Google Colab存储

时间:2018-10-27 15:19:07

标签: storage google-colaboratory google-cloud-tpu

有人知道运行Google Colab的存储限制吗?上传22gb的zip文件,然后尝试解压缩后,似乎空间不足,建议使用<〜40gb的存储空间。至少这是我运行TPU实例的经验。

2 个答案:

答案 0 :(得分:2)

目前,colab中的本地存储量取决于所选的硬件加速器运行时类型:

# Hardware accelerator none
!df -h .
Filesystem      Size  Used Avail Use% Mounted on
overlay          49G   22G   26G  46% /

# Hardware accelerator GPU
!df -h .
Filesystem      Size  Used Avail Use% Mounted on
overlay         359G   23G  318G   7% /

# Hardware accelerator TPU
!df -h .
Filesystem      Size  Used Avail Use% Mounted on
overlay          49G   22G   26G  46% /

即使您不需要GPU,切换到该运行时类型也将为您提供额外的310Gb存储空间。

答案 1 :(得分:1)

是的,Colab笔记本电脑的本地存储现在大约为40 GiB。一种查看确切值的方法(在Python 3中):

import subprocess
p = subprocess.Popen('df -h', shell=True, stdout=subprocess.PIPE)
print(str(p.communicate()[0], 'utf-8'))

但是::对于大量数据,本地存储是馈送TPU的非最佳方式,TPU没有直接连接到运行笔记本电脑的计算机。相反,请考虑将大型数据集存储在GCP存储中,然后从Colab笔记本中获取该数据。 (此外,Colab本地存储量可能会发生变化,并且Colab笔记本本身将在几个小时后到期,并随身携带本地存储。)

看看the canonical TPU Colab notebook。底部是一些后续步骤,其中包括指向Searching Shakespeare with TPUs的链接。该笔记本中有以下代码片段,向您的Colab TPU演示了GCP身份验证。看起来像这样:

from google.colab import auth
auth.authenticate_user()

if 'COLAB_TPU_ADDR' in os.environ:
  TF_MASTER = 'grpc://{}'.format(os.environ['COLAB_TPU_ADDR'])

  # Upload credentials to TPU.
  with tf.Session(TF_MASTER) as sess:    
    with open('/content/adc.json', 'r') as f:
      auth_info = json.load(f)
    tf.contrib.cloud.configure_gcs(sess, credentials=auth_info)
  # Now credentials are set for all future sessions on this TPU.
else:
  TF_MASTER=''