这是每日/每周安排Spark Jobs的推荐工具。 1)Oozie 2)路易吉 3)阿兹卡班 4)Chronos 5)气流
提前致谢。
答案 0 :(得分:5)
从此处更新我以前的答案:Suggestion for scheduling tool(s) for building hadoop based data pipelines
理念:
更简单的管道比复杂的管道更好:更易于创建,更易于理解(特别是在您不创建时)并且更易于调试/修复。
当需要复杂的操作时,您希望以完全成功或完全失败的方式封装它们。
如果你能使它成为幂等的(再次运行会产生相同的结果),那就更好了。