我需要一些帮助,将S3中不同公司分区中的多个文件合并到一个文件中,公司名称作为列之一。
我是新手,我无法找到任何信息,我也说过支持,他们说不支持。但在DataStage中,它是将多个文件合并为一个的基本功能。 请多点亮一点 问候, 普拉卡什
答案 0 :(得分:1)
如果文件中的列名相同且列数也相同,则Glue会自动将它们组合在一起。
确保要合并的文件位于s3上的同一文件夹中,并且您的胶水抓取工具指向该文件夹。
答案 1 :(得分:0)
查看AWS Glue examples,尤其是Join and Rationalize Data in S3示例。它向您展示了如何使用Python脚本对变换进行连接和过滤。