我在EC2微型实例上运行单机Hadoop设置。 我写了一个简单的wordcount程序,没有明确指定应该运行的Map或Reduce任务的数量,输入文件<1MB。 在这种情况下启动的Map Tasks的数量是2,为什么会这样?
如果我使用conf.setNumMapTasks(1),则只启动1个Map。
即使输入文件<1MB,M / R如何确定需要2个Map任务?
答案 0 :(得分:0)
每个作业的默认地图任务数为2.这是“mapred.map.tasks”属性的默认值为2.
在此验证文档: http://hadoop.apache.org/docs/r1.0.4/mapred-default.html
答案 1 :(得分:0)
如上所述,每个作业的默认地图任务数为2. Hadoop块大小和inputsplit中有两个术语。映射的数量通常由Mapper Task的inputspl决定。