如果在Hadoop 1.x中运行100个Mapper,将启动多少个任务跟踪器来完成Mapper作业?
答案 0 :(得分:1)
只提到了地图制作者,我想这只是一个地图工作。
首先,任务跟踪器是hadoop守护进程,它们将在所有"所有"计算集群的节点。所以真正的问题必须是用于完成工作的地图槽的数量。
在具有2个映射槽的(单节点)伪分布式集群中,两个插槽将至少使用50次来执行100个映射任务,考虑到在作业过程中零推测任务执行(并且映射任务为no)其他工作同时进行。
在具有至少100个计算节点的群集中,每个任务跟踪器中有一个映射插槽,然后这100个插槽将用于完成作业(没有推测执行)。