标签: mapreduce hadoop2
答案 0 :(得分:0)
输入数据以及地图功能将被提交给资源管理器。
数据的位置将提供给RM,以便所有读取都将首先放置为NODE_LOCAL。在需要远程读取之前,数据本身不会移出数据节点。
此输入格式在哪里
类本身位于hadoop classpath所示的路径上。拆分不是单独的数据对象,它仅与HDFS文件中的边界标记有关。
hadoop classpath
是在任务分配给节点管理器之前完成的输入拆分,还是在任务分配给节点管理器之后完成的输入拆分
在分配资源之前计算拆分。分割数决定了映射器的数量