最后我正在研究Google Colab 我得到了这个数据集colled celeba,它进入了Google驱动器帐户,并且该帐户不是我的帐户,但我可以访问它 现在,由于互联网问题和驱动器容量,我无法卸载数据集,然后将其上传到我的驱动器...所以问题是:有什么方法可以让Google colab访问该数据集,也可以采用这种方式导入路径。 ..
我在下面有此函数定义
create_celebahq_cond_continuous('/content/drive/My Drive/kiki96/results/tfrecords','https://drive.google.com/open?id=0B7EVK8r0v71pWEZsZE9oNnFzTm8','https://drive.google.com/open?id=0B4qLcYyJmiz0TXY1NG02bzZVRGs',4,100,False)
我尝试放置数据集的可共享链接的地方,但这不起作用
请帮助
答案 0 :(得分:9)
如果您要将文件直接下载到Google Colab实例中,则可以使用gdown
。
请注意,该文件必须与公众共享。
如果数据集的链接为https://drive.google.com/file/d/10vAwF6hFUjvw3pf6MmB_S0jZm9CLWbSx/view?usp=sharing
,则可以使用:
!gdown --id "10vAwF6hFUjvw3pf6MmB_S0jZm9CLWbSx"
相反,如果要将其下载到驱动器中,则
安装您的Google云端硬盘
from google.colab import drive
drive.mount('/content/drive')
将目录更改为Google云端硬盘中的文件夹
cd '/content/drive/My Drive/datasets/'
将文件下载到您的Google云端硬盘文件夹
!gdown --id "10vAwF6hFUjvw3pf6MmB_S0jZm9CLWbSx"
如果您要下载文件夹,请按照以下步骤操作:
将您的Google云端硬盘安装到Google Colab
转到添加了快捷方式的文件夹
您可以看到新添加的文件夹,该文件夹由其Google云端硬盘文件夹ID引用。
答案 1 :(得分:1)
您可以在此处使用脚本来下载整个文件夹。
https://github.com/segnolin/google-drive-folder-downloader
我已经将它变成一个简单的功能。
Data Date
ID
1 A 2020-01-04 23:50:00
2 D 2020-03-28 08:15:00
3 E 2020-03-26 07:20:00
您可以简单地使用folder_id对其进行调用。
def folder_download(folder_id):
# authenticate
from google.colab import auth
auth.authenticate_user()
# get folder_name
from googleapiclient.discovery import build
service = build('drive', 'v3')
folder_name = service.files().get(fileId=folder_id).execute()['name']
# import library and download
!wget -qnc https://github.com/segnolin/google-drive-folder-downloader/raw/master/download.py
from download import download_folder
download_folder(service, folder_id, './', folder_name)
return folder_name
它将在Colab中创建该文件夹。