从aws s3存储桶下载yfcc100m

时间:2017-01-11 07:29:47

标签: amazon-web-services amazon-s3 dataset s3cmd

我正在尝试下载AWS中托管的数据集。 我正在尝试使用s3cmd并使用我的访问密钥和密钥对其进行配置。 我可以使用以下方法正确列出存储桶中的文件:

s3cmd ls s3://yahoo-webscope/I3set13/

我使用get下载数据集:

s3cmd get --recursive s3://yahoo-webscope/I3set13/

但显示以下错误:

ERROR: S3 error: 403 (Forbidden)

我发现一些解决方案建议更改存储桶策略,但由于我不是所有者,因此我无法对其进行更改。

请让我知道问题背后的原因以及我如何解决它。

1 个答案:

答案 0 :(得分:2)

根据https://multimediacommons.wordpress.com/yfcc100m-core-dataset/,尽管数据集托管在S3存储桶中,但对其的访问受到限制,因此您需要submit a request并按照其他电子邮件说明进行访问:

  

获取YFCC100M :可以在Yahoo Webscope申请数据集。如果您还没有雅虎帐户,则需要创建雅虎帐户,登录后您会发现直接提交YFCC100M请求。 Webscope将要求您告诉他们您对数据集的计划是什么,这有助于他们证明其学术推广计划的存在,并允许他们在将来继续提供数据集。与Webscope提供的其他数据集不同,YFCC100M不要求您成为认可大学的学生或教师,因此您将自动获得批准。