2即使输入小于块大小,也会启动Map任务。什么确定Map任务的数量?

时间:2013-05-29 07:16:22

标签: hadoop mapreduce hdfs

我在EC2微型实例上运行单机Hadoop设置。 我写了一个简单的wordcount程序,没有明确指定应该运行的Map或Reduce任务的数量,输入文件<1MB。 在这种情况下启动的Map Tasks的数量是2,为什么会这样?

如果我使用conf.setNumMapTasks(1),则只启动1个Map。

即使输入文件<1MB,M / R如何确定需要2个Map任务?

2 个答案:

答案 0 :(得分:0)

每个作业的默认地图任务数为2.这是“mapred.map.tasks”属性的默认值为2.

在此验证文档: http://hadoop.apache.org/docs/r1.0.4/mapred-default.html

答案 1 :(得分:0)

如上所述,每个作业的默认地图任务数为2. Hadoop块大小和inputsplit中有两个术语。映射的数量通常由Mapper Task的inputspl决定。