标签: amazon-web-services etl aws-glue aws-dms data-lake
我正在尝试在S3上建立一个数据湖。实时数据通过AWS DMS提取到S3文件夹中。 DMS会先写入一次加载的csv文件,然后在单独的csv文件中写入后续更新和删除。现在,我正在尝试使用AWS Glue将此数据加载到另一个包含最终更新数据的S3文件夹中。如何使用AWS Glue处理传入数据中的更新和删除?