在字数统计程序中使用2个减速器的输出

时间:2018-02-16 02:24:03

标签: hadoop mapreduce reducers

让我们说用键“the”,“sound”,“is”的键值对由reducer 1处理,键值对用键“it”,“right”处理, “声音”由减速器2处理。

两个减速器的输出是什么?

每个reducer的输出文件是否会被排序然后组合再排序?

当减速器收到它们时,它是否按字母顺序排序,以便减速器1接收“是”,“它”,“右”,减速器2接收“声音”,“声音”,“声音”?

1 个答案:

答案 0 :(得分:1)

回答您的疑问:

  1. 减速器的输出将是其出现的字和数。
  2. 永远不会组合使用不同键的减速机输出。 mapreduce中没有这样的阶段。
  3. 映射器的输出被分类并送入reducer;但是不同的reducer随机发出其输出,并且所有reducers的输出都不再排序。 mapreduce中没有这样的阶段。
  4. 尽管reducers按排序顺序获取密钥,但请将每个reducer运行到一个单独的JVM和一个单独的进程中。他们输出的数据没有"知道"还有更多的减速机正在运行。