如何在虚拟机上通过命令行获取kaggle竞争数据?

时间:2017-07-23 03:17:24

标签: cookies machine-learning command-line wget kaggle

我正在寻找使用bash在虚拟机上下载kaggle竞赛数据(训练和测试)的最简单方法,以便能够在那里训练它而无需在git上上传。

4 个答案:

答案 0 :(得分:2)

三年后快进,您可以使用CLI使用Kaggle's API,例如:

kaggle competitions download favorita-grocery-sales-forecasting

答案 1 :(得分:1)

首先,您需要在文本文件中复制kaggle网站的cookie信息。有chrome extension可以帮助您完成此操作。 复制cookie信息并将其另存为cookies.txt。

现在使用命令

将文件传输到EC2实例
scp -i /path/my-key-pair.pem /path/cookies.txt user-name@ec2-xxx-xx-xxx-x.compute-1.amazonaws.com:~

接受比赛规则并从kaggle.com复制您要下载的数据集的网址。例如,下载Intel & MobileODT Cervical Cancer Screening竞赛的sample_submission.csv文件的网址为:https://kaggle.com/c/intel-mobileodt-cervical-cancer-screening/download/sample_submission.csv.zip

现在,从终端使用以下命令将数据集下载到实例中。

wget -x --load-cookies cookies.txt https://kaggle.com/c/intel-mobileodt-cervical-cancer-screening/download/sample_submission.csv.zip

答案 2 :(得分:0)

安装CurlWget chrome扩展程序。

开始下载您的kaggle数据集。 CurlWget将为您提供完整的wget命令。将此命令粘贴到sudo终端。

工作完成。

答案 3 :(得分:0)

  1. 在Chrome上安装cookies.txt扩展名并启用它。
  2. 登录到kaggle
  3. 转到要从中获取数据的挑战页面
  4. 单击右上角的cookie.txt扩展名,它将下载当前页面的cookie。它将以cookies.txt文件的形式下载cookie
  5. 使用scp或其他方法将文件传输到远程服务
  6. 复制kaggle页面上显示的数据链接(右键单击并复制链接地址)
  7. 运行wget -x --load-cookies cookies.txt <datalink>