对于我来说,COCO数据集非常大,可以将其上传到google colab。有什么方法可以直接将数据集下载到google colab?
答案 0 :(得分:1)
另一种方法可能是仅将PyCoco API上传到Google Colab。无需下载图像数据集。我们将使用my post on medium。接下来,在准备图像时,您可以使用URL读取图像文件,而不是从云端硬盘/本地文件夹访问图像文件!
# The normal method. Read from folder / Drive
I = io.imread('%s/images/%s/%s'%(dataDir,dataType,img['file_name']))
# Instead, use this! Url to load image
I = io.imread(img['coco_url'])
此方法将为您节省大量空间,下载时间和精力。但是,在训练过程中您将需要可以正常工作的Internet连接以获取图像(因为您正在使用colab,所以您当然可以拥有它)。
答案 1 :(得分:0)
您可以直接使用wget下载
!wget http://images.cocodataset.org/zips/train2017.zip
此外,您应该使用GPU实例,该实例可提供350 GB的更大空间。
答案 2 :(得分:0)
您可以将其下载到Google驱动器,然后将驱动器安装到Colab。
from google.colab import drive
drive.mount('/content/drive')
然后,您可以CD到包含数据集的文件夹,例如。
import os
os.chdir("drive/My Drive/cocodataset")
答案 3 :(得分:0)
使用驱动器可以更好地进一步使用。还可以使用 colab ( !unzip ) 解压缩 zip,因为在驱动器上使用 zip 提取器需要更长的时间。我试过了 :D