使用AWS胶水将CSV转换为拼花地板时,为什么会创建多个文件?

时间:2019-10-10 03:59:08

标签: python-2.7 amazon-web-services aws-glue

我正在将一个csv文件转换为镶木地板并将其存储到s3位置,但是当我检查位置时,我得到的是多个文件而不是一个文件?

1 个答案:

答案 0 :(得分:0)

默认情况下,Spark / Glue并行写入数据以优化写入。您可以在写入之前使用coalesce()方法强制写入一个文件。