应用错误收集

使用scala将镶木地板数据写入S3上的文件

时间：2017-02-17 03:47:55

标签： scala amazon-s3 parquet amazon-athena

有没有办法使用scala快速稳定地在S3上编写拼花数据？

2 个答案:

答案 0 :(得分：0)

是的 - 使用Spark 掌握了数据框后，您可以使用df.write.parquet("s3a://newfilename")

答案 1 :(得分：0)

如果您愿意，可以从独立安装中长期使用s3a，但我建议不要因为性能问题而将其用作工作的直接目的地。最好在本地输出然后将其复制到那里（hadoop distcp这样做）。