Oozie输出事件

时间:2012-10-29 09:18:37

标签: hadoop mapreduce oozie oozie-coordinator

我不明白Ozzie中输出事件的用途是什么。 Ozzie文档声明“协调器操作可以生成一个或多个数据集实例作为输出”,但它没有给出任何实际细节或示例。生成数据集实例作为输出意味着什么?是否意味着Ozzie将通过数据集的URI模板将文件夹创建为输出?我真的不明白我为什么要使用输出evet ...

谢谢!

2 个答案:

答案 0 :(得分:1)

如果您在谈论Oozie,输出文件将用于连接不同的协调员作业。考虑一个协调员工作的大型DAG,一些工作可能会将其他工作的输出作为其输入。因此数据集是DAG中的边。

例如,在Oozie配置文件中,如果指定协调器A的输出为DS1,协调器B的输出为DS2,协调器C的输入为DS1,DS2,则Oozie将保证协调器C中的相应操作将为在DS1和DS2准备好之前不执行。

答案 1 :(得分:1)

在协调员中至少有一种指定<output-event>的用法。重新运行一系列日期的协调器(使用oozie job -rerun命令)时,将删除指定为<output-event>的所有相应路径。

有时删除协调器实例生成的所有输出很有用。例如,当您想要启动另一个具有<input-event>路径的协调器时,您希望确保它将处理重新运行的数据而不是旧数据。