实例组无法使用GPU创建实例:资源不足

时间:2018-12-03 13:35:18

标签: google-cloud-platform google-compute-engine

我能够使用NVIDIA-K80手动创建实例,但是我的实例组在该实例上显示警告:

Instance 'instance-6lqk' creation failed: The zone 'projects/my-project/zones/us-central1-a' does not have enough resources available to fulfill the request. Try a different zone, or try again later.

注意:两者都在同一区域中创建

2 个答案:

答案 0 :(得分:2)

(适用于Google的作品)

您收到的错误消息表明您已正确完成所有操作,但区域无法满足您的请求。由于各种原因,有时会在单个区域中发生这种情况。我的建议是使用多个区域和/或多个区域,以便在一个区域中发生这种情况时,您可以简单地在另一个区域中创建容量。

请注意,许多希望在许多GPU上运行大型工作负载的Preemptible GPU用户正是这样做的。在许多区域中要求配额并运行多区域实例组,以便有最大的机会获得最大可能的访问权限。

答案 1 :(得分:1)

我从Google doc

的实例模板创建了实例组

使用下面的Google文档中的相同示例:

gcloud beta compute instance-templates create gpu-template \
--machine-type n1-standard-2 \
--boot-disk-size 250GB \
--accelerator type=nvidia-tesla-k80,count=1 \
--image-family ubuntu-1604-lts --image-project ubuntu-os-cloud \
--maintenance-policy TERMINATE --restart-on-failure \
--metadata startup-script='#!/bin/bash
echo "Checking for CUDA and installing."
# Check for CUDA and try to install.
if ! dpkg-query -W cuda-9-0; then
  curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
  dpkg -i ./cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
  apt-get update
  apt-get install cuda-9-0 -y
fi'

但是在创建GPU实例时,我发现了some条建议。确保您在区域中有必要的配额,Michael谈到了GPU限制。

希望它对您有用。