关于hadoop中map-reduce执行的查询

时间:2012-06-01 19:47:19

标签: hadoop

假设数据在其节点中不存在并存在于其他一些机器中,

  • 任务跟踪器如何知道哪个节点包含数据?

  • 是否直接与该数据节点对话?或者它会联系自己的数据节点,并且负责复制这些数据吗?

1 个答案:

答案 0 :(得分:1)

  

任务跟踪器如何知道哪个节点包含数据?

TaskTracker不知道它。 JobTracker联系Namenode,获取数据的位置,并尽力将数据从一个节点分配到同一节点上的TaskTracker(或尽可能接近)。

  

是否直接与该数据节点对话?或者它将联系自己的数据节点,它将负责复制该数据吗?

直接与Datanode对话。