我需要下载Flicker YFCC-100M数据集。我有亚马逊AWS账户,但无法找到下载数据集的方法。 There is blog but it is not clear for me to download the dataset
使用flicker API,我可以下载图片但不会是YFCC100M。
Here是一个建议,但awscli无法安装在我的系统上。
>> sudo apt install awscli
>> ..........
>> Error: Unable to correct problems, you have held broken packages.
是否有任何简单的方法可以下载此数据集。
答案 0 :(得分:1)
这假设您已经安装了pip,并在您的系统上安装了Python 2.6.5+或Python 3.3+。如果要安装awscli,则需要运行
pip install awscli --upgrade --user
您可以阅读有关安装AWS命令行界面(CLI)here的更多信息。
此外,我认为this link可以让您访问您正在寻找的数据集。
答案 1 :(得分:0)
您需要在Yahoo Webscope website上注册并将此数据集添加到"购物车"。 提交数据集请求后,您应该会收到一封包含说明的电子邮件。在删除一些细节和特权信息之后,我正在复制这封电子邮件的一部分。
- 从http://s3tools.org/download下载并安装s3cmd(或使用适用于您平台的相应软件包管理器)
- 运行' s3cmd - 配置'并输入您的访问密钥和密码(可通过 XXXXXXXX < - 获取,实际链接将在其电子邮件中 )。您还可以在此处指定其他选项,例如启用 传输过程中加密,并启用代理。
- 运行' s3cmd ls s3:// yahoo-webscope / XXXXXXX /'查看I3的S3对象 - Yahoo Flickr Creative Commons 100M(14G)(在AWS上托管)
- 运行' s3cmd get --recursive s3:// yahoo-webscope / XXXXXXX /'下载I3的本地副本 - Yahoo Flickr Creative Commons 100M(14G) (在AWS上托管)
醇>
您应该很容易按照这些步骤获取数据集。我同意,他们的网站上的步骤不是很透明!