据我所知,Hadoop 1.x具有辅助名称节点,但用于创建主要名称节点的映像,并在失败并再次启动时更新主要名称节点。但是,鉴于我们已经有一个热备用存在,Hadoop 2.x中二级namenode的用途是什么?
答案 0 :(得分:2)
据我所知,Hadoop 2.x可以通过两种方式完成:
<强> 1。使用HA(高可用性群集):如果要设置HA群集,则可能不需要使用辅助名称节点,因为备用名称节点使其状态与活动名称节点保持同步。
HDFS NameNode高可用性功能使您可以在具有热备用的主动/被动配置中运行同一群集中的冗余NameNode。NameNode需要相同类型的硬件配置。在HA hadoop群集中Active NameNode读取和写入元数据Separate JournalNode中的信息。
如果发生故障转移,备用NameNode将确保在更改为活动状态之前根据编辑日志完全更新其命名空间。因此,在此群集设置中不需要Secondary NameNode。
<强> 2。没有HA:,您可以在没有备用节点的情况下进行hadoop设置。然后,辅助NameNode将按照您在Hadoop 1.x
中已经提到的那样运行答案 1 :(得分:0)
为NameNodes配置HA时,不使用Secondary Namenode。但是,您仍然可以在没有HA的情况下配置HDFS(具有NameNode和Secondary NameNode)。自hadoop 1.x以来,这部分没有太大变化。