我有多个粘合作业 J1 , J2 , J3 ,它们是通过AWS Lamda触发的,而Lambda是通过S3上的文件触发的桶。
序列如下:-
S3(桶B1)-添加文件-> L1(Lambda触发)-> J1(胶水 作业)->插入数据T1表(RedSfhift)
S3(桶B2)-添加文件-> L2(Lambda触发)-> J2(胶水 作业)->插入数据T2表(RedSfhift)
S3(Bucket B3)-添加文件-> L3(Lambda触发)-> J3(胶水 作业)->插入数据T3表(RedSfhift)
现在,在完成所有这3个作业之后,我想触发一个单独的Glue作业( JFinal ),该作业将处理来自T1,T2和T3的数据并进行一些计算,然后将其插入最终表。
现在我们如何触发作业 JFinal 。 J1,J2,J3作业是独立的,执行顺序可以不同。
答案 0 :(得分:1)
AWS Step函数将是一个很好的解决方案。您必须配置您的步进机器,其中您的3个作业可以独立运行,但JFinal
仍将等待,直到所有其他作业都完成。请参阅:Step Functions Getting Started