在TPU上使用Cloud ML Engine运行TensorFlow培训师可生成google.rpc.QuotaFailure

时间:2017-12-25 14:59:43

标签: tensorflow gpu google-cloud-ml google-cloud-tpu

我使用scaleTier: BASIC在Cloud ML Engine上开发了TensorFlow模型。

使用scaleTier: BASIC_GPU在GPU上实验运行其训练器可以正常工作。但尝试在scaleTier: BASIC_TPU的TPU上运行它会产生以下错误消息:

type.googleapis.com/google.rpc.QuotaFailure
The request for 1 TPU_V2 accelerators exceeds the allowed maximum
of 30 K80, 30 P100.

这种限制来自何处,是否可以取消,例如通过启用另一个API或增加我的初始预算?

2 个答案:

答案 0 :(得分:2)

announced at Google Cloud Next '18一样,云TPU现在为available to everyone,没有列入白名单。

要为Cloud ML Engine启用它们,请转到此处:

https://cloud.google.com/ml-engine/docs/tensorflow/using-tpus

...向下滚动到标题“授权Cloud TPU以访问您的项目”,然后按照那里的说明进行操作。简而言之,您需要为您的资源提供对已创建的TPU的IAM访问。

答案 1 :(得分:1)

我尝试了同样的事情并得到了相同的结果。文档暗示每个人都可以使用TPU,但事实并非如此。据我所知,您必须specially request TPU访问(我填写了请求但没有得到回复)。