在GCP AI平台上创建模型版本时出错

时间:2019-10-28 11:28:32

标签: google-cloud-ml

我正在尝试创建模型的版本并将其链接到导出的Tensorflow模型。但是它给了我以下错误:health probe timeout: generic::unavailable: The fetch failed with status 3 and reason: UNREACHABLE_5xx Check the url is available and that authentication parameters are specified correctly

我已经将我的SaveModel目录公开了,并用 service-xxxxxxxxxxxx@cloud-ml.google.com.iam.gserviceaccount.com 附加到了我的存储桶中> Storage Legacy Bucket Reader 。我的服务帐户 service-xxxxxxxxxxxx@cloud-ml.google.com.iam.gserviceaccount.com 的角色为 ML Engine Admin和Storage Admin 。 bucket和ml-engine是相同项目 us-central1 区域的一部分。我正在使用以下配置初始化模型版本:

Python version: 2.7
Framework: TensorFlow
Framework version: 1.12.3
Runtime version: 1.12
Machine type: n1-highmem-2
Accelerator: Nvidia Tesla K-80 
Accelerator count: 1

注意:我将python 2.7用于培训和运行时版本1.12

1 个答案:

答案 0 :(得分:0)

是否可以使用CLI验证“保存的模型”是否有效。 检查您保存的模型中是否有服务标签集,请使用SavedModel CLI

saved_model_cli show --dir <your model directory>