如何在pyspark中有效地阅读带有100GB拼花文件的s3桶?

时间:2017-05-24 01:01:46

标签: amazon-s3 pyspark

在S3中读取包含多个子文件夹的存储桶的最佳方法是什么?如何并行化读取?

0 个答案:

没有答案