map的顺序和并行执行减少

时间:2014-06-09 13:32:02

标签: hadoop mapreduce

我对Hadoop很新,需要在下面的方案中提供帮助。让我们说有5个MR工作

  P1(MR1+ MR2 ) -->// MR1 and MR2 run sequentially



P2(MR3+MR4)// // MR3 and MR4 run sequentially

and P1 and P2 run parallel way .Output of P1 and P2 will be joined By MR5.

如何在hadoop中定义这种复杂的工作流程?

1 个答案:

答案 0 :(得分:0)

如果您有更复杂的要求,请查看Oozie:Oozie

对于简单的要求,您可以在Job API中使用依赖关系管理。