标签: hadoop mapreduce task replication
我有一个mapreduce程序,并在具有1个主设备和5个从设备的Hadoop-2.9上运行。在此程序中,处理每个记录是一项任务。因此,每个任务都是由一个映射器计算的。
问题:
如何复制任务,以便由两个映射器计算任务?否则每个任务将执行两次。