如何在Oozie中分叉动作

时间:2015-04-14 23:48:42

标签: hadoop mapreduce oozie oozie-coordinator

我有许多序列文件和要在每个文件上执行的操作的工作流程。所有文件的工作流程都相同,输入文件的数量可能会有所不同。我想使用Oozie中的fork机制并行地在一堆输入文件(比如10个文件)上执行工作流程。如果输入文件的数量是固定的,我知道应该执行多少工作流程并且可以轻松编写一个fork,但是因为它可能会有所不同,所以我不知道应该如何编写fork。有什么想法?

1 个答案:

答案 0 :(得分:0)

您可以编写java oozie客户端,它将接受多个文件作为参数,并且可以并行调用许多工作流,并在所有工作流执行成功时返回。否则,您可能必须以编程方式生成具有所需数量的fork分支的工作流。