如何在Google Cloud ML上使用自定义预处理和数据文件进行推理

时间:2019-05-28 20:14:07

标签: google-cloud-ml

我想使用我训练有素的模型来推断Google Cloud ML。这是一个NLP模型,我希望我的node.js服务器与该模型进行交互,以便在训练时获得预测。

我有一个手动在模型上运行推理的过程,我想在云中复制它:

  1. 使用Stanford Core NLP标记我的文本并生成存储标记我的文本的数据文件。
  2. 让模型使用这些数据文件,从中创建Tensorflow示例,然后运行模型。
  3. 让模型打印出预测。

这就是我认为可以在云中复制它的方式:

  1. 使用我的node.js服务器将文本发送到云中。
  2. 运行我的python脚本以生成数据文件。看来我将不得不在自定义预测例程中执行此操作。我不确定如何在这里使用Stanford Core NLP。
  3. 将数据文件保存在Google Cloud的存储桶中。
  4. 在自定义预测例程中,加载保存的数据文件并执行模型。

有人可以告诉我此过程是否正确吗?另外,如何在Google Cloud自定义预测例程上运行Stanford CoreNLP?另外,是否有一种方法可以让我只运行命令行脚本(例如,用于创建数据文件,我有一个通常会运行以创建它们的简单命令)?

1 个答案:

答案 0 :(得分:0)

您可以在Python中实现自定义预处理方法,然后从那里调用Stanford工具包。有关详细信息,请参见此博客和相关的示例代码:https://cloud.google.com/blog/products/ai-machine-learning/ai-in-depth-creating-preprocessing-model-serving-affinity-with-custom-online-prediction-on-ai-platform-serving