如何使用Glue

时间:2018-02-16 02:31:36

标签: amazon-web-services amazon-s3 aws-glue

我需要一些帮助,将S3中不同公司分区中的多个文件合并到一个文件中,公司名称作为列之一。

我是新手,我无法找到任何信息,我也说过支持,他们说不支持。但在DataStage中,它是将多个文件合并为一个的基本功能。 请多点亮一点 问候, 普拉卡什

2 个答案:

答案 0 :(得分:1)

如果文件中的列名相同且列数也相同,则Glue会自动将它们组合在一起。

确保要合并的文件位于s3上的同一文件夹中,并且您的胶水抓取工具指向该文件夹。

答案 1 :(得分:0)

查看AWS Glue examples,尤其是Join and Rationalize Data in S3示例。它向您展示了如何使用Python脚本对变换进行连接和过滤。