应用错误收集

如何在pyspark中有效地阅读带有100GB拼花文件的s3桶？

时间：2017-05-24 01:01:46

标签： amazon-s3 pyspark

在S3中读取包含多个子文件夹的存储桶的最佳方法是什么？如何并行化读取？

0 个答案:

没有答案