如何在能够读取原始输入的情况下在Hadoop中链接作业

时间:2014-04-02 18:54:17

标签: hadoop chain

我想链接3轮MapReduce,在第三轮可以读取原始输入以及第二个作业的输出。这有可能吗?

1 个答案:

答案 0 :(得分:1)

您可以设置最后一个作业以使用2个映射器,其中一个可以将原始文件作为输入。假设您需要在某些公共密钥上减少输入(第一个作业的输入和第二个作业的输出)。 MultipleInputs