应用错误收集

让我试着详细说明：

在hadoop中，名字节点是单点故障。

好吧，如果您使用ZKFC（ZooKeeper故障转移控制器）在主动 - 备用模式下有2个NameNode设置进行自动故障转移，那么NameNode不是单点故障。

如果你沿着hadoop使用spark，Zookeeper会照顾hadoop通常会有的单点故障吗？

有多种方法可以在旁边的hadoop上运行/使用spark。

或者它仍然依赖于hdfs输入的namenode

是的，Spark仍然必须回复NameNode才能从HDFS读取数据。每个HDFS读/写请求都必须通过NameNode，NameNode具有提供实际数据所需的元数据信息。