如何在Amazon S3中存储程序的输出?

时间:2016-01-22 01:00:50

标签: amazon-web-services amazon-s3 storage emr

我有一个AWS EMR集群。我为运行该程序的集群创建了一个步骤" samplespark.py" (包含在S3存储桶中)。 samplespark.py创建一个文件并将一些输出写入该文件,或者至少在我在我的计算机上测试时会这样做。当我在AWS EMR上运行samplespark.py时,我找不到输出文件。

如何将输出文件写入Amazon S3存储桶?

1 个答案:

答案 0 :(得分:0)

或者您可以使用minio client aka mc

您可以将结果直接作为对象传递给S3存储桶。

$ python samplespark.py | mc pipe s3 / myoutput / output.txt

希望它有所帮助。