如何处理YARN MapReduce作业的容器故障?

时间:2015-06-07 14:36:35

标签: hadoop mapreduce yarn hadoop2

YARN如何处理软件/硬件故障?具体来说,在容器发生故障/崩溃的情况下会发生什么?

2 个答案:

答案 0 :(得分:4)

  • 容器和任务失败由node-manager处理。当容器发生故障或死亡时,node-manager会检测到故障事件并启动新容器以替换发生故障的容器,并在新容器中重新启动任务执行。
  • 如果应用程序主机发生故障,资源管理器会检测到故障并使用新容器启动应用程序主机的新实例。

查找详细信息here

答案 1 :(得分:0)

  • 应用程序主控将重新尝试完成异常或停止响应的任务(默认为4次) _具有两个很多失败任务的工作被视为失败工作。