在AWS胶中完成多个相关作业后运行作业

时间:2019-12-24 08:06:58

标签: amazon-web-services aws-lambda aws-glue

我有多个粘合作业 J1 J2 J3 ,它们是通过AWS Lamda触发的,而Lambda是通过S3上的文件触发的桶。

序列如下:-

  

S3(桶B1)-添加文件-> L1(Lambda触发)-> J1(胶水   作业)->插入数据T1表(RedSfhift)

     

S3(桶B2)-添加文件-> L2(Lambda触发)-> J2(胶水   作业)->插入数据T2表(RedSfhift)

     

S3(Bucket B3)-添加文件-> L3(Lambda触发)-> J3(胶水   作业)->插入数据T3表(RedSfhift)

现在,在完成所有这3个作业之后,我想触发一个单独的Glue作业( JFinal ),该作业将处理来自T1,T2和T3的数据并进行一些计算,然后将其插入最终表。

现在我们如何触发作业 JFinal 。 J1,J2,J3作业是独立的,执行顺序可以不同。

1 个答案:

答案 0 :(得分:1)

AWS Step函数将是一个很好的解决方案。您必须配置您的步进机器,其中您的3个作业可以独立运行,但JFinal仍将等待,直到所有其他作业都完成。请参阅:Step Functions Getting Started