如何将Kaggle数据集加载到Intel DevCloud Jupyter Notebook中

时间:2020-01-12 17:41:56

标签: python jupyter-notebook intel kaggle

我是Intel DevCloud的新用户,正在尝试直接从kaggle加载数据集。我怎样才能做到这一点。我尝试了以下方法。

pip install kaggle
kaggle competitions download -c bengaliai-cv19

但是未安装Kaggle。它说:

OSError: [Errno 30] Read-only file system: '/glob/intel-python/versions/2018u2/intelpython3/lib/python3.6/site-packages/text_unidecode'

解决方案是什么?

1 个答案:

答案 0 :(得分:1)

步骤:

  1. 在开发云中打开一个终端(在左上角为+)

  2. 在终端中键入以下内容

    pip install kaggle

  3. 要使用Kaggle API,请在kaggle官方页面(https://www.kaggle.com)中创建一个帐户。然后,转到用户个人资料的“ 我的帐户”标签,然后选择“ 创建新的API令牌”。这会将kaggle.json文件下载到您的系统中。

  4. 将.json文件上传到devcloud

  5. 键入命令以将.json文件复制到kaggle根文件夹

    cp -r "kaggle.json" "/home/u51xxx/.kaggle"

  6. 检查可用数据集列表

    kaggle datasets list -s bengaliai-cv19

enter image description here

(-s表示搜索,后跟数据集的名称)

  1. 要下载数据集类型:

    kaggle datasets download (filename obtained in the list)