无法使用Tensorflow 2.0框架创建深度学习VM

时间:2019-10-05 15:27:05

标签: google-cloud-platform

我正在尝试使用使用tensorflow 2.0的Google Cloud Platform创建深度学习虚拟机。但是当我实例化它时,出现以下错误:

deep-learning-training-vm: {"ResourceType":"compute.v1.instance","ResourceErrorCode":"400","ResourceErrorMessage":{"code":400,"errors":[{"domain":"global","message":"Invalid value for field 'resource.disks[0].initializeParams.sourceImage': 'https://www.googleapis.com/compute/v1/projects/click-to-deploy-images/global/images/tf-2-0-cu100-experimental-20190909'. The referenced image resource cannot be found.","reason":"invalid"}],"message":"Invalid value for field 'resource.disks[0].initializeParams.sourceImage': 'https://www.googleapis.com/compute/v1/projects/click-to-deploy-images/global/images/tf-2-0-cu100-experimental-20190909'. The referenced image resource cannot be found.","statusMessage":"Bad Request","requestPath":"https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-west1-b/instances","httpMethod":"POST"}}

我不太了解该错误,但我相信gcp无法为我的虚拟机找到正确的映像,即其中包含此版本的tensorflow的映像(可能是因为TF 2.0版本?)

以前有人遇到过这个问题吗?有没有办法使用Tensorflow 2.0创建DL VM?

1 个答案:

答案 0 :(得分:0)

这似乎是一个暂时性的问题,因为它现已上市。

此外,您可以通过gcloud创建DL VM。这是命令的示例:

gcloud compute instances create INSTANCE_NAME \
  --zone=ZONE \
  --image-family=tf2-latest-cu100 \
  --image-project=deeplearning-platform-release \
  --maintenance-policy=TERMINATE \
  --accelerator="type=nvidia-tesla-v100,count=1" \
  --metadata="install-nvidia-driver=True,proxy-mode=project_editors" \
  --machine-type=n2-highmem-8

DL documentation中有更多有关此操作的信息。

此外,如果您希望使用Tensorflow和Jupyter创建VM,则可以尝试使用AI Platform Notebooks

create a new Notebook时,您可以选择Tensorflow 2.0并进一步对其进行自定义以选择加速器,机器类型等。