我有两个阶段map-reduce hadoop程序。 (mapper1,reducer1,mapper2,reducer2)。我可以将一些mapper1键值直接传递给reducer1,其他一些键值直接传递给mapper2吗?
答案 0 :(得分:0)
你可以为你想要reducer1处理的那些正常放置映射器设置键值,而去mapper2的那些有一些任意键名(让我们在Text.class类中任意说“TO_MAPPER_2”) 。然后你的reducer代码在if语句中,这样它只在key不是“TO_MAPPER_2”时执行。这将确保reducer不会处理您的值,并且将通过您用于发送它们的任何方法来更改mapper2。