我正在寻找一种简单的方法来在地图缩减作业后链接后处理代码
具体来说,涉及重命名\移动文件由org.apache.hadoop.mapred.lib.MultipleOutputs
创建(该类对输出文件名有限制,所以我不能直接在mapreduce作业中生成文件)
我知道(或想到)的选项是:
答案 0 :(得分:1)
你的简单"任务应该是一个Mapper专用的工作。您的Map()接收文件名作为键并重命名该文件。为此,您必须编写自己的InputFormat和RecordReader,就像在链接中一样,但是RecordReader实际上不应该读取文件,只需在getCurrentKey()中返回文件名: