在HA hadoop设置中需要3个日志节点

时间:2017-05-31 12:50:11

标签: hadoop hdfs high-availability

我对hadoop很新。当我使用qoroum日记管理器设置一个hadoop namenode ha时,我对这些要求感到有些困惑。关于apache网站的官方文件说

  

注意:必须至少有3个JournalNode守护进程,因为编辑日志修改必须写入大多数JN。

这意味着什么?为什么我们需要3个日志节点而不是2个?

1 个答案:

答案 0 :(得分:3)

  1. 与hadoop1一样,如果某个名称节点变得不可用,那么每个群集只能有一个Namenode,整个群集将变得不可用,从而使其成为单点故障。
  2. 要解决此问题,显而易见的解决方案是为每个群集添加多个Namenode。
  3. 在haoop2中,每个群集可以有两个Namenode。一次只有一个Namenode处于活动状态,而其他Namenode处于待机模式。要使系统HA两者都应该同步Namenode。为此,他们引入了概念日志节点。
  4. 这个轻量级恶魔的目的是将活动Namenode中的每个更改同步到备用Namenodes。
  5. 现在该日志节点会失败怎么办?这将再次成为同一个问题.journal节点将成为单点故障。为了避免这种情况,他们引入了像Zookeeper中引入的法定人数概念。
  6. Quorum的意思是什么?

    法定人数: - 法定人数的字面含义是必须出席才能使会议有效的最低议会/社团成员人数。

    在类似的说明中,必须始终超过一半的总日志节点才能保持一切正常运行。例如,如果系统中有2个日志节点,则必须保持超过一半'即2个以上的Journal节点健康以保持一切运行。这意味着在这种情况下您无法承担任何日志节点故障。为避免这种情况,您必须具有奇数个日志节点(即3,5,7)。但最低3,以便我们可以承受日志节点故障。

    我希望这有帮助