Hadoop框架如何决定运行Map作业的节点

时间:2016-04-18 07:24:49

标签: hadoop mapreduce

根据我的理解,存储在HDFS中的文件被分成块,并且每个块都被复制到多个节点,默认情况下为3。 Hadoop框架如何在复制特定块的所有节点中选择运行映射作业的节点。

2 个答案:

答案 0 :(得分:0)

据我所知,map任务的数量与块的数量相同。

请参阅手册here

通常,框架会选择靠近输入块的节点,以减少map任务的网络带宽。

这就是我所知道的。

答案 1 :(得分:0)

在Mapreduce 1中,它取决于承载副本的datanode中运行的地图任务的数量,因为地图任务的数量在MR1中是固定的。在MR2中没有固定的插槽,因此它取决于已在该节点中运行的任务的数量。