每当我向Hadoop集群提交代码时:
map
函数并将属性计算添加到数据节点map
函数在本地数据的每个节点上执行reduce
函数在每个节点上执行reduce
函数并聚合结果。假设前面描述的步骤是正确的,那么从这个步骤改变第2步的要求是什么:
public void map(Args args) {
for(Arg arg : args)
someCalculations(arg);
}
进入这个:
public void map(Args args) {
executeOtherSofwareAndFetchResultst(args);
}
例如,其他软件是否需要HDFS兼容性?
答案 0 :(得分:0)
映射器就像普通的Java实例一样。您可以使用映射器中的普通Java程序执行任何操作。 将它视为另一个Java实例,只要您将数据放入映射器,就不需要与HDFS的任何软件兼容性,因为映射器处理它而不是它内部的逻辑。