我不明白Ozzie中输出事件的用途是什么。 Ozzie文档声明“协调器操作可以生成一个或多个数据集实例作为输出”,但它没有给出任何实际细节或示例。生成数据集实例作为输出意味着什么?是否意味着Ozzie将通过数据集的URI模板将文件夹创建为输出?我真的不明白我为什么要使用输出evet ...
谢谢!
答案 0 :(得分:1)
如果您在谈论Oozie,输出文件将用于连接不同的协调员作业。考虑一个协调员工作的大型DAG,一些工作可能会将其他工作的输出作为其输入。因此数据集是DAG中的边。
例如,在Oozie配置文件中,如果指定协调器A的输出为DS1,协调器B的输出为DS2,协调器C的输入为DS1,DS2,则Oozie将保证协调器C中的相应操作将为在DS1和DS2准备好之前不执行。
答案 1 :(得分:1)
在协调员中至少有一种指定<output-event>
的用法。重新运行一系列日期的协调器(使用oozie job -rerun
命令)时,将删除指定为<output-event>
的所有相应路径。
有时删除协调器实例生成的所有输出很有用。例如,当您想要启动另一个具有<input-event>
路径的协调器时,您希望确保它将处理重新运行的数据而不是旧数据。