我能够使用NVIDIA-K80手动创建实例,但是我的实例组在该实例上显示警告:
Instance 'instance-6lqk' creation failed: The zone 'projects/my-project/zones/us-central1-a' does not have enough resources available to fulfill the request. Try a different zone, or try again later.
注意:两者都在同一区域中创建
答案 0 :(得分:2)
(适用于Google的作品)
您收到的错误消息表明您已正确完成所有操作,但区域无法满足您的请求。由于各种原因,有时会在单个区域中发生这种情况。我的建议是使用多个区域和/或多个区域,以便在一个区域中发生这种情况时,您可以简单地在另一个区域中创建容量。
请注意,许多希望在许多GPU上运行大型工作负载的Preemptible GPU用户正是这样做的。在许多区域中要求配额并运行多区域实例组,以便有最大的机会获得最大可能的访问权限。
答案 1 :(得分:1)
使用下面的Google文档中的相同示例:
gcloud beta compute instance-templates create gpu-template \
--machine-type n1-standard-2 \
--boot-disk-size 250GB \
--accelerator type=nvidia-tesla-k80,count=1 \
--image-family ubuntu-1604-lts --image-project ubuntu-os-cloud \
--maintenance-policy TERMINATE --restart-on-failure \
--metadata startup-script='#!/bin/bash
echo "Checking for CUDA and installing."
# Check for CUDA and try to install.
if ! dpkg-query -W cuda-9-0; then
curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
dpkg -i ./cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
apt-get update
apt-get install cuda-9-0 -y
fi'
但是在创建GPU实例时,我发现了some条建议。确保您在区域中有必要的配额,Michael谈到了GPU限制。
希望它对您有用。