我有一系列需要运行的mapreduce作业。我想知道是否有使用Oozie的优势,而不是有一个大司机"会运行那个序列吗?
我知道Oozie可以用来运行不同类型的多个动作,例如猪脚本,shell脚本,先生的工作,但我特别感兴趣的是,如果我分开我的两份工作并使用Oozie运行它们,或者只有一个罐子来完成它?
答案 0 :(得分:0)
Oozie是一个调度程序 - 粗略,文档记录不足,但是调度程序。
......好吧,不要使用调度程序。
PS:你也有Luigi (Spotify)和Azkaban (LinkedIn)作为替代Hadoop调度程序。
[edit] 要考虑的额外要点:如果您的“司机”因任何原因崩溃,您可能没有机会发送提醒;但如果从Oozie运行,最终将检测到崩溃(可能需要多达30分钟。在角落的情况下,例如由于YARN RM故障转移导致AM作业自毁)