标签: mapreduce
看起来很简单,只有一点我不太明白是如何进行改组?你怎么能在这里为每个单词创建一个篮子?
答案 0 :(得分:4)
map的输出键,值对(让我们称之为K,V)根据键的哈希进行分区。
map
K,V
具有相同K,V的所有hash(K)对都会发送到同一个reducer。每个reducer中的K,V对按键排序并按键分组。
hash(K)
reduce然后依次处理每个键及其所有相关值。
reduce
N.B。在Hadoop(以及可能的其他M / R实现)中,分区,排序和分组功能可以由用户定义。