我正在尝试使用使用tensorflow 2.0的Google Cloud Platform创建深度学习虚拟机。但是当我实例化它时,出现以下错误:
deep-learning-training-vm: {"ResourceType":"compute.v1.instance","ResourceErrorCode":"400","ResourceErrorMessage":{"code":400,"errors":[{"domain":"global","message":"Invalid value for field 'resource.disks[0].initializeParams.sourceImage': 'https://www.googleapis.com/compute/v1/projects/click-to-deploy-images/global/images/tf-2-0-cu100-experimental-20190909'. The referenced image resource cannot be found.","reason":"invalid"}],"message":"Invalid value for field 'resource.disks[0].initializeParams.sourceImage': 'https://www.googleapis.com/compute/v1/projects/click-to-deploy-images/global/images/tf-2-0-cu100-experimental-20190909'. The referenced image resource cannot be found.","statusMessage":"Bad Request","requestPath":"https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-west1-b/instances","httpMethod":"POST"}}
我不太了解该错误,但我相信gcp无法为我的虚拟机找到正确的映像,即其中包含此版本的tensorflow的映像(可能是因为TF 2.0版本?)
以前有人遇到过这个问题吗?有没有办法使用Tensorflow 2.0创建DL VM?
答案 0 :(得分:0)
这似乎是一个暂时性的问题,因为它现已上市。
此外,您可以通过gcloud创建DL VM。这是命令的示例:
gcloud compute instances create INSTANCE_NAME \
--zone=ZONE \
--image-family=tf2-latest-cu100 \
--image-project=deeplearning-platform-release \
--maintenance-policy=TERMINATE \
--accelerator="type=nvidia-tesla-v100,count=1" \
--metadata="install-nvidia-driver=True,proxy-mode=project_editors" \
--machine-type=n2-highmem-8
DL documentation中有更多有关此操作的信息。
此外,如果您希望使用Tensorflow和Jupyter创建VM,则可以尝试使用AI Platform Notebooks。
create a new Notebook时,您可以选择Tensorflow 2.0并进一步对其进行自定义以选择加速器,机器类型等。