假设数据在其节点中不存在并存在于其他一些机器中,
任务跟踪器如何知道哪个节点包含数据?
是否直接与该数据节点对话?或者它会联系自己的数据节点,并且负责复制这些数据吗?
答案 0 :(得分:1)
任务跟踪器如何知道哪个节点包含数据?
TaskTracker不知道它。 JobTracker联系Namenode,获取数据的位置,并尽力将数据从一个节点分配到同一节点上的TaskTracker(或尽可能接近)。
是否直接与该数据节点对话?或者它将联系自己的数据节点,它将负责复制该数据吗?
直接与Datanode对话。