我在最新的hadoop 2.7.3上运行10,000,000个数字的Terasort。但是,纱线任务总是会失败,除非群集中只有一个NodeManager运行。此外,stdout或log中没有明确的错误消息或异常。唯一的消息是$element.popover("show");
,在日志中,容器或任务尝试突然从RUNNING转换为失败状态。
我在互联网上找到的解决方案包括禁用超时或调整内存配置都不起作用。实际上,对于他们的问题,日志中存在错误消息或异常,而我的完全不同。
那么这个问题的可能原因是什么?任何解决方案吗?
标准输出如下:
"TEST TEST"
此处还有详细的NodeManager日志的一部分,显示容器或任务尝试失败:
Task Id: attempt_xxxx Status: FAILED