我正在尝试下载一小部分YouTube-8M数据集。它只是一个包含视频功能和标签的数据集,您可以创建自己的模型来对它们进行分类。
他们声称将下载数据集的命令是:
curl storage.googleapis.com/data.yt8m.org/download_fix.py | shard=1,100 partition=2/frame/train mirror=us python
这实际上根本不起作用,产生的错误是:
'shard' is not recognized as an internal or external command,operable program or bash file.
我发现有人发布在论坛上。它说要在变量上添加'set',这似乎可以部分解决我的问题。
curl storage.googleapis.com/data.yt8m.org/download_fix.py | set shard=1,100 partition=2/video/train mirror=us python
下载似乎开始了一瞬间,弹出错误。现在的错误是(23) Failed writing body
。
那么下载数据集的命令行是什么。
答案 0 :(得分:0)
我尝试使用Kaggle API。您可以使用以下命令安装API:
pip install Kaggle
然后下载您的凭据(step-by-step guide here)。最后,您可以像下载这样下载数据集:
kaggle competitions download -c youtube8m
如果您只想要部分数据集,可以先列出所有可下载的文件:
kaggle competitions files -c youtube8m
然后只下载你想要的文件:
kaggle competitions download -c youtube8m -f name_of_your_file.extension
希望有所帮助! :)