将COCO数据集导入到Google colaboratory

时间:2019-04-07 08:18:04

标签: python computer-vision google-colaboratory semantic-segmentation

对于我来说,COCO数据集非常大,可以将其上传到google colab。有什么方法可以直接将数据集下载到google colab?

4 个答案:

答案 0 :(得分:1)

另一种方法可能是仅将PyCoco API上传到Google Colab。无需下载图像数据集。我们将使用my post on medium。接下来,在准备图像时,您可以使用URL读取图像文件,而不是从云端硬盘/本地文件夹访问图像文件!

# The normal method. Read from folder / Drive
I = io.imread('%s/images/%s/%s'%(dataDir,dataType,img['file_name']))

# Instead, use this! Url to load image
I = io.imread(img['coco_url'])

此方法将为您节省大量空间,下载时间和精力。但是,在训练过程中您将需要可以正常工作的Internet连接以获取图像(因为您正在使用colab,所以您当然可以拥有它)。

如果您对使用COCO数据集感兴趣,可以查看enter image description here

答案 1 :(得分:0)

您可以直接使用wget下载

!wget http://images.cocodataset.org/zips/train2017.zip

此外,您应该使用GPU实例,该实例可提供350 GB的更大空间。

答案 2 :(得分:0)

您可以将其下载到Google驱动器,然后将驱动器安装到Colab。

from google.colab import drive
drive.mount('/content/drive')

然后,您可以CD到包含数据集的文件夹,例如。

import os
os.chdir("drive/My Drive/cocodataset")

enter image description here

答案 3 :(得分:0)

使用驱动器可以更好地进一步使用。还可以使用 colab ( !unzip ) 解压缩 zip,因为在驱动器上使用 zip 提取器需要更长的时间。我试过了 :D