Hadoop排序阶段耗时数小时

时间:2014-10-26 16:22:38

标签: java sorting hadoop mapreduce

我开始使用hadoop一周了。在成功运行示例之后,我使用了WordCuce示例来查找最常用的单词。

我尝试使用500 MB或数据来运行此作业。

然而,地图任务需要数小时。它目前在地图上67%减少0%。

地图任务日志如下所示:

2014-10-24 11:19:52,274 DEBUG [IPC Parameter Sending Thread #0] org.apache.hadoop.ipc.Client: IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001 sending #2554
2014-10-24 11:19:52,278 DEBUG [IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001] org.apache.hadoop.ipc.Client: IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001 got value #2554
2014-10-24 11:19:52,279 DEBUG [communication thread] org.apache.hadoop.ipc.RPC: Call: ping 5
2014-10-24 11:19:55,279 DEBUG [IPC Parameter Sending Thread #0] org.apache.hadoop.ipc.Client: IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001 sending #2555
2014-10-24 11:19:55,280 DEBUG [IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001] org.apache.hadoop.ipc.Client: IPC Client (592959754) connection to /xxx.xx.xx.xx:52026 from job_1414134493988_0001 got value #2555
2014-10-24 11:19:55,280 DEBUG [communication thread] org.apache.hadoop.ipc.RPC: Call: ping 1

这是假设发生的,需要那么长时间吗?

1 个答案:

答案 0 :(得分:0)

一些提示:

  • 你的意思是多久(多久)?
  • 在地图任务长时间运行的情况下进行堆栈跟踪并查看其被卡住的位置?
  • 他们经常失败的任务状态是什么?
  • 群集中有多少map和reduce?