标签: hadoop azkaban
由于Azkaban上的作业太多,我必须手动测试新作业逐个。
Azkaban
假设我上传了一些新作业,是否可以编写Python(或任何其他语言)脚本来获取这些作业之间的依赖关系,然后在Azkaban 中进行并行运行?
Python
例如,a, b, c上有b和a个工作。他们应该被安排如下:
a, b, c
b
a
开始运行工作a 和工作c
c
当工作完成后,开始执行工作b。
我在Azkaban官方网站上找不到任何有用的信息或API(也许我错过了有用的信息)。
感谢任何帮助。