我们正在开发环境中设置Hadoop集群。在我们测试NameNode的故障转移时,我们注意到Zookeeper故障转移控制器有时会崩溃。在一个案例中,ZooKeeper和ZooKeeper故障转移控制器都崩溃了。
在我们的测试中,两个NameNodes 处于活动状态。这将导致Hadoop群集中的裂脑场景。
我们使用以下版本: - hadoop-2.7.3 - zookeeper-3.4.10
我们有两个四服务器集群。其中两台服务器专用于NameNode,另外两台服务器专用于DataNode。
NameNode服务器上运行的组件是 - NameNode - ZooKeeper - ZooKeeper故障转移控制器 - JournalNode
DataNode服务器上运行的组件是 - DataNode - ZooKeeper - JournalNode