Question

我对Hadoop很新，需要在下面的方案中提供帮助。让我们说有5个MR工作

  P1(MR1+ MR2 ) -->// MR1 and MR2 run sequentially



P2(MR3+MR4)// // MR3 and MR4 run sequentially

and P1 and P2 run parallel way .Output of P1 and P2 will be joined By MR5.

如何在hadoop中定义这种复杂的工作流程？

Answer 1

如果您有更复杂的要求，请查看Oozie：Oozie

对于简单的要求，您可以在Job API中使用依赖关系管理。

map的顺序和并行执行减少

1 个答案: