如何将整个数据目录与RDS同步

时间:2019-06-18 08:36:00

标签: python amazon-web-services aws-glue

我的目标是始终使用RDS(MSSQL)中的模式自动复制S3存储桶。

我有一个Glue搜寻器,它在每次S3上传时都由lambda函数触发。因此,数据目录始终与S3同步。我能够创建Glue作业,该作业会自动从目录中上传特定表。 如果用户上载具有新列的新表,则必须手动为该表创建一个新作业。有没有办法自动执行此手动步骤?

1 个答案:

答案 0 :(得分:0)

如果您希望在搜寻器发现新表时触发一些逻辑,建议您考虑为Glue服务中的状态更改创建一个Cloudwatch Event Rule。具体来说,您可以在数据目录数据库或表的状态更改时调用服务(即Lambda函数)。

此lambda函数可以检查状态更改事件,并使用其中一个SDK为新表创建作业。