从ML Engine工作(Google Cloud Platform)中获取培训师状态

时间:2017-07-31 08:50:53

标签: python tensorflow google-cloud-platform

我们有以下架构与GCP(Google云端平台)连接:

  • Module A:远程启动ML Engine作业(例如:来自AWS,我们的本地计算机......)
  • Module B:GCP(ML引擎)。接受外部请求并运行我们配置的特定培训师。
  • Module C:培训师。它由ML Engine运行。它运行learn进程并在/export/Servo/<timestamp>
  • 下创建模型

因此,根据我们在GCP文档中看到的,要覆盖此路径,我们需要重新实现我们完全想要避免的estimator.export_savedmodel

我们考虑的另一个解决方案是将输出文件夹从培训师发送到ML Engine作业,这样当我们的Module A询问ML Engine作业的状态时,它会获得输出文件夹。

有办法做到这一点吗?有没有更简单的方法?

1 个答案:

答案 0 :(得分:0)

也许您可以查看此https://cloud.google.com/ml-engine/docs/managing-models-jobs以查看ML引擎作业的摘要。 Job.state显示它是否在QUEUED中,或者它已经完成(已成功,失败,取消)

gcloud ml-engine jobs describe $JOBNAME --summarize