通过API从外部训练模型

时间:2018-01-12 10:06:48

标签: google-cloud-ml

我们已成功部署了我们的预测模型,并能够为我们的应用程序调用预测。但是,我们希望在我们的应用程序中使用它时不断训练模型。每当用户看到预测错误时,这将发送一组数据。我已经检查了文档,但只发现了创建作业的API。

有没有办法通过API向GCP-ML外部发送培训数据?如果是,请提供文档。

1 个答案:

答案 0 :(得分:0)

根据我对您的问题的理解,您正在寻找的功能是:

  • 有一些进程(例如流媒体管道)可以访问标记数据
  • 所述进程发送实例以进行预测
  • 流程将模型中的预测与已知标签进行比较
  • 标记数据用于更新模型
  • 更新的模型可用于预测

Google的CloudML Engine目前不支持这作为一流的用例。

根据我们的经验,生产环境(尤其是业务关键流程)的更安全模型不会在没有事先评估的情况下自动更新生产中的模型。所以一个共同的范例是:

  • 等待一些新数据进入(例如1天的日志,或者甚至只是几小时或几分钟的新数据)
  • 使用新数据
  • 更新模型的副本
  • 评估更新的模型以确保更好
  • 如果是这样,请将模型作为新版本推送到生产阶段(以便轻松恢复到旧版本)并使用分阶段部署逐步将新流量引导至新版本。

有关详细信息,您可能对this KDD paper on TFX感兴趣,https://api-platform.com/docs/core/swagger#header尚未作为服务或开源提供。