具有多个输出的Hadoop MapReduce递归?

时间:2013-06-10 10:10:59

标签: recursion hadoop mapreduce

嗨我有每个递归步骤中取减速器输出的map reduce程序。但我还需要在每次递归时输出另一个结果。

INPUT1 --->地图1 - >降低1 - > output1和output11

OUTPUT1 --->地图2 - >降低2 - > output2和output22

OUTPUT2 ---> MAP3 - > Reduce3 - > output3和output33

OUTPUT3 ---> MAP4 - > Reduce4 - > output4和output44

作为我需要的最终输出:output11,output22,output33,output44和output4

这样每个步骤都有2个输出文件,其中1个进入下一次迭代,其他进入输出。

我正在使用SequenceFileAsTextInputFormat。

任何帮助,谢谢你

1 个答案:

答案 0 :(得分:0)

您可以为每个递归步骤创建一个map reduce作业,并使用1递归步骤的输出文件进行下一个map reduce工作