我们为高可用性配置了应用程序。
在2个节点中,其中一个节点处于活动状态(比如NN1),另一个节点(比如说NN2)NameNode进程被终止。所以现在NN1是活跃的。
现在我们提交一个mapreduce作业,日志一直在说
“应用程序提交尚未完成,提交的应用程序application_someid仍处于NEW_SAVING”。
这种情况持续了大约17分钟,然后成功执行了作业。 这意味着发生了故障转移并且NN1处于活动状态。但为什么需要这么长时间?
纱线节点管理员日志说:
INFO org.apache.hadoop.ipc.Client:重试连接到服务器:。已经尝试了9次;重试策略是RetryUpToMaximumCountWithFixedSleep(maxRetries = 10,sleepTime = 1000 MILLISECONDS)
有人可以解释为什么会这样吗?
提前致谢
答案 0 :(得分:0)
我不知道这个问题的原因, 但重新启动纱线服务可以帮助我解决这个问题。