应用错误收集

如何在Google Cloud ML上使用自定义预处理和数据文件进行推理

时间：2019-05-28 20:14:07

标签： google-cloud-ml

我想使用我训练有素的模型来推断Google Cloud ML。这是一个NLP模型，我希望我的node.js服务器与该模型进行交互，以便在训练时获得预测。

我有一个手动在模型上运行推理的过程，我想在云中复制它：

使用Stanford Core NLP标记我的文本并生成存储标记我的文本的数据文件。
让模型使用这些数据文件，从中创建Tensorflow示例，然后运行模型。
让模型打印出预测。

这就是我认为可以在云中复制它的方式：

使用我的node.js服务器将文本发送到云中。
运行我的python脚本以生成数据文件。看来我将不得不在自定义预测例程中执行此操作。我不确定如何在这里使用Stanford Core NLP。
将数据文件保存在Google Cloud的存储桶中。
在自定义预测例程中，加载保存的数据文件并执行模型。

有人可以告诉我此过程是否正确吗？另外，如何在Google Cloud自定义预测例程上运行Stanford CoreNLP？另外，是否有一种方法可以让我只运行命令行脚本（例如，用于创建数据文件，我有一个通常会运行以创建它们的简单命令）？

1 个答案:

答案 0 :(得分：0)

您可以在Python中实现自定义预处理方法，然后从那里调用Stanford工具包。有关详细信息，请参见此博客和相关的示例代码：https://cloud.google.com/blog/products/ai-machine-learning/ai-in-depth-creating-preprocessing-model-serving-affinity-with-custom-online-prediction-on-ai-platform-serving