数据流传输到Google Cloud ML Engine

时间:2017-07-11 19:10:18

标签: google-api-client google-cloud-ml google-cloud-ml-engine

我发现Google ml引擎需要云存储,大查询等数据。有没有办法将数据流式传输到ml-engine。例如,假设我需要使用WordPress或Drupal站点中的数据来创建张量流模型,比如垃圾邮件检测器。一种方法是将整个数据导出为CSV,并使用google-cloud-php库将其上传到云存储。这里的问题是,对于每次微小的更改,我们都必须上传整个数据。还有更好的办法吗?

1 个答案:

答案 0 :(得分:0)

通过微小的改动,您的意思是"当您获得新数据时,您必须将所有内容 - 旧数据和新数据 - 再次上传到gcs"?一个想法是在一些时间表上将新数据导出到gcs,随着时间的推移制作许多csv文件。您可以编写培训师以获取文件模式,并使用get_matching_files/Glob或多个文件路径进行扩展。

您还可以修改训练代码,从旧检查点开始,只训练新数据(位于自己的文件中)几步。