我的Hadoop集群在8台CentOS 6.3计算机上运行,Hadoop版本是CDH 4.3(从Coludera Manager 4.6安装)。 最近我发现我的一些工作失败了。失败的任务将在下一次尝试中成功。但是,失败的任务是如此之多(50000个任务,1000个失败),我担心这会导致性能问题或其他潜在问题。 所有失败的任务都具有相同的调用堆栈:
java.lang.Throwable: Child Error
at org.apache.hadoop.mapred.TaskRunner.run(TaskRunner.java:250)
Caused by: java.io.IOException: Creation of symlink from /var/log/hadoop-0.20-mapreduce/userlogs/job_201311140947_0002/attempt_201311140947_0002_m_051950_0 to /hdfs7/mapred/local/userlogs/job_201311140947_0002/attempt_201311140947_0002_m_051950_0 failed.
at org.apache.hadoop.mapred.TaskLog.createTaskAttemptLogDir(TaskLog.java:126)
at org.apache.hadoop.mapred.DefaultTaskController.createLogDir(DefaultTaskController.java:72)
at org.apache.hadoop.mapred.TaskRunner.prepareLogFiles(TaskRunner.java:295)
at org.apache.hadoop.mapred.TaskRunner.run(TaskRunner.java:215)
我尝试在同一路径上手动构建符号链接,但没有遇到任何问题。我想知道导致这个问题的原因。