Hadoop Multi Output维护从地图

时间:2016-04-24 14:42:01

标签: hadoop mapreduce hadoop2

我正在尝试从hadoop中的reducer实现多输出。文件是正确创建的,问题是文件的页眉和页脚没有进入适当的位置(即,从地图发出的记录的顺序被更改)。我有一个映射器和多个减速器。

我尝试为每个地图记录添加一个索引(如整数),并将其从reducer键中删除,但它提供的文件已存在异常。我正在使用自定义比较器根据索引值对键进行排序。

关于我缺少什么的任何想法。

0 个答案:

没有答案