使用AWS Glue处理数据湖中的更新和删除

时间:2018-11-15 06:06:23

标签: amazon-web-services etl aws-glue aws-dms data-lake

我正在尝试在S3上建立一个数据湖。实时数据通过AWS DMS提取到S3文件夹中。 DMS会先写入一次加载的csv文件,然后在单独的csv文件中写入后续更新和删除。现在,我正在尝试使用AWS Glue将此数据加载到另一个包含最终更新数据的S3文件夹中。如何使用AWS Glue处理传入数据中的更新和删除?

0 个答案:

没有答案