应用错误收集

Hadoop内置了一些High availability机制。＆＃39; Secondary NameNode＆＃39;，＆＃39; Backup JobTracker＆＃39;将作为各自对手的热门备份。

过去的大多数＆＃39; SPOF＆＃39;已经被最近的hadoop版本淘汰了。

以下文档对此进行了深入解释。

希望它有所帮助。

HDFS和Mapreduce是Hadoop的核心组件。在早期的Apache Hadoop版本中，Namenode和Jobtracker是SPOF（只能配置一个实例）。从Hadoop 2.X修复此问题。

Jobtracker HA。

通过在Jobtracker(JT)模式下在两个节点上配置2 Active - Standby实例，可以实现Jobtracker HA。如果一个JT发生故障，第二个Jobtracker将可用于提供请求。一次只有一个jobtracker（Active）可用于服务请求，第二个JT（待机）将以只读模式运行。 Jobtracker HA需要zookeeper实例，故障转移（切换）可以配置为Manaul或Automcatic。自动故障转移需要另一个名为Failover Controller (FC)的进程。在当前版本中，如果活动JT失败，则将暂停所有正在运行的作业，但是新作业将自动提交给新JT。当前版本中不提供此功能。

MR2是使用YARN的第二代mapreduce，Resource Manager(RM)是YARN中的主服务，RM也可以在活动 - 备用模式下配置。 RM故障不会影响正在运行的作业/应用程序。

Namenode HA

Namenode HA很重要。 Namenode HA也可以配置为活动 - 备用模式（最多2个名称节点实例）。 Quorum based Journaling是广泛接受的方法，它在内部使用zookeeper。一次只能激活一个名称节点。

Secondary Namenode(SNN)不是Standby Namenode(SN)，反之亦然，SNN在非HA配置中具有不同的功能，Namenode HA设置不需要SNN，因为SN namenode执行检查点（SNN的功能）

Processes Namenode HA

Active namenode
Standby namenode
故障转移控制器：用于防护以避免裂脑情况。
Jounalnodes（需要最少3个实例）：命名空间修改将记录到Journal节点，Standby namenode从那里读取。为了避免裂脑问题，一次只允许一个namenode写入。

减轻Hadoop的跟腱

2 个答案: