标签: hadoop mapreduce
我对Hadoop很新,需要在下面的方案中提供帮助。让我们说有5个MR工作
P1(MR1+ MR2 ) -->// MR1 and MR2 run sequentially P2(MR3+MR4)// // MR3 and MR4 run sequentially and P1 and P2 run parallel way .Output of P1 and P2 will be joined By MR5.
如何在hadoop中定义这种复杂的工作流程?
答案 0 :(得分:0)
如果您有更复杂的要求,请查看Oozie:Oozie
对于简单的要求,您可以在Job API中使用依赖关系管理。