用于常见问题/推荐系统的Google Prediction API

时间:2016-05-27 07:15:50

标签: nlp google-cloud-platform google-prediction

我想建立自动化的常见问题解答系统,用户可以提出一些问题,根据问题和他们对培训数据的回答,应用程序会提出一组答案。

这可以通过Prediction API实现吗? 如果是,我应该如何创建我的培训数据?

我已经测试了用于情绪分析的Prediction API。但对将其用作FAQ /推荐系统存在疑虑和困惑。

我的训练数据有以下结构:

“问题”:“如何创建电子邮件帐户?”
“答案”:“步骤1:xxxxxxxx步骤2:xxxxxxxxxxxxx步骤3:xxxxx xxx xxxxx”
“问题”:“谁可以查看我的联系人列表?”
“答案”:“xxxxxx xxxx xxxxxxxxxxxx x xxxxx xxx”

2 个答案:

答案 0 :(得分:0)

训练您的数据,如输入是问题,输出是答案

当您发送问题作为预测输入时,可以提供答案的输出。

简单常见问题你会摇滚。

但如果你在PHP中完成了帮助我也是人。

答案 1 :(得分:0)

要使用Prediction API,您必须首先根据一组训练数据对其进行训练。在培训过程结束时,Prediction API会为您的数据集创建模型。每个模型都是分类的(如果答案列是字符串)或回归(如果答案列是数字)。该模型将保留,直到您明确删除它。该模型仅从原始训练课程和任何更新呼叫中学习;它不会继续学习您发送给它的Predict查询。

培训数据可以通过以下方式之一提交:

  1. 逗号分隔值(CSV)文件。每行都是一个示例,包含一组数据以及该示例的答案(类别或值),如上面两个数据示例所示。训练文件中的所有答案必须是分类或数字;你不能把两者混在一起。上传培训文件后,您将告诉Prediction API对其进行培训。

  2. 直接嵌入到请求中的培训实例。训练实例可以嵌入 trainingInstances 参数中。注意:由于HTTP请求大小的限制,这仅适用于小型数据集(<2 MB)。

  3. 通过更新通话。首先,通过将空 storageDataLocation trainingInstances 参数传入Insert调用来训练空模型。然后,使用Update调用传递训练实例以更新空模型。注意:由于并非所有分类器都可以更新,因此与在整个数据集上批量训练模型相比,这可能会导致模型精度降低。

  4. 您可以在此帮助中心article中获取更多信息。

    注意:用于PHP的Google Prediction API客户端库仍处于测试阶段。