如何清理从RedShift卸载的S3文件?

时间:2013-08-11 01:54:55

标签: amazon-s3 amazon-redshift

我正在使用Amazon Redshift进行数据分析,有时我使用'unload'将RedShift表卸载到S3中,然后将数据复制到另一个Redshift实例中。

由于我只需要在执行'卸载'时指定数据文件的前缀,并且它将在S3存储桶中创建许多文件,我需要一种优雅的方法来清理所有这些数据文件。我不想枚举存储桶中的每个对象,并检查密钥是否与前缀匹配。

1 个答案:

答案 0 :(得分:1)

从s3tools获取s3cmd非常容易(从http://s3tools.org/s3cmd获取您自己的副本)

首先使用命令配置此程序:

s3cmd --configure

然后剩下的就是一个命令:

s3cmd del s3://your-bucket/some/dir/prefix*