我正在阅读过去几周的hadoop框架,但我无法理解一个概念。可能这个问题很愚蠢,如果不是那么抱歉。 我的问题是假设我必须在一个太长的文件上创建一个字数统计程序,因此它分布在3个不同的数据节点上。现在,由于在所有三个数据节点上运行的映射阶段将创建为键值对,之后将对所有三个数据节点创建的所有地图数据执行合并。但现在我无法理解下一阶段是什么。意味着合并数据将如何沿着不同的减少阶段分布,以及将运行多少减少阶段以及将运行多少数据节点减少阶段。请清除我以上的所有混淆,因为这样我无法在hadoop中进一步移动。 如果是这样的话,抱歉这是一个愚蠢的问题。 谢谢
答案 0 :(得分:0)
compateTo()
方法实现进行排序并合并数据。 (例如,有树不同的组产生A,B和C)。