使用gcloud套件相对较新,我在使用更多GPU启动实例时遇到了麻烦。最初添加第一个GPU并没有要求增加配额。
但是,当我请求再次增加我的GPU配额以改善模型的训练时间时,在获得批准并为我的实例分配了另一个GPU之后,我仍然收到一条错误消息,因为我的实例超出了我的实例尽管在管理控制台中看到配额为2,但分配的配额为1。
控制台:
错误:
启动实例my-fastai-instance ...失败。
错误:(gcloud.compute.instances.start)配额'PREEMPTIBLE_NVIDIA_T4_GPUS'已超出。限制:在us-west1地区为1.0。
为了让额外的GPU与实例一起工作,我是否还需要更改其他内容?
答案 0 :(得分:2)
不幸的是,“ NVIDIA T4 GPU”和“可抢占的NVIDIA T4 GPU”之间是有区别的。
“ NVIDIA T4 GPU”的配额为2,而我认为–“抢先NVIDIA T4 GPU”的配额为1。
像以前一样,您需要按地区要求这些。
NB 您应该可以立即将实例从请求“可抢占的NVIDIA T4 GPU”切换为“ NVIDIA T4 GPU”