高可用性:名称节点故障转移后,作业未立即提交

时间:2015-11-03 10:15:27

标签: yarn high-availability

我们为高可用性配置了应用程序。

在2个节点中,其中一个节点处于活动状态(比如NN1),另一个节点(比如说NN2)NameNode进程被终止。所以现在NN1是活跃的。

现在我们提交一个mapreduce作业,日志一直在说

“应用程序提交尚未完成,提交的应用程序application_someid仍处于NEW_SAVING”

这种情况持续了大约17分钟,然后成功执行了作业。 这意味着发生了故障转移并且NN1处于活动状态。但为什么需要这么长时间?

纱线节点管理员日志说:

INFO org.apache.hadoop.ipc.Client:重试连接到服务器:。已经尝试了9次;重试策略是RetryUpToMaximumCountWithFixedSleep(maxRetries = 10,sleepTime = 1000 MILLISECONDS)

有人可以解释为什么会这样吗?

提前致谢

1 个答案:

答案 0 :(得分:0)

我不知道这个问题的原因, 但重新启动纱线服务可以帮助我解决这个问题。