应用错误收集

PigStorage如何为S3工作？

时间：2012-11-25 08:33:25

标签： amazon-s3 apache-pig

我想知道Pig中的PigStorage如何将数据存储到S3？它是否将输出保存到HDFS然后将其复制？或者将每个reducer输出保存到每个reducer的本地目录，然后将它们复制到S3？我想这不能流，因为S3只支持放置文件或目录？

1 个答案:

答案 0 :(得分：2)

我的理解是每个reducer在本地写入其输出，然后将输出复制到S3。

正如您所说 - 由于S3不支持流式传输，因此减速器只能在完成处理后复制其输出。