应用错误收集

针对特定上下文的Google Cloud Natural Language API自定义

时间：2017-08-09 16:01:13

标签： android google-app-engine nlp google-cloud-nl

我们正在编写一个演示应用，其中我们使用了Google的云语音API和自然语言API。我们将它用于电视机和机顶盒中的语音控制。

总的来说，我必须说API工作得很好。

但是，我们想知道是否可以自定义Natural Language API，以便在我们的行业中更具体。

更具体地说，我们遇到了传递给特定实体的显着性分数的问题。

E.g。将以下文本数据传递到Google Cloud API： “给我看看像Zoolander这样的电影。”

给我们以下结果：

实体名称|实体类型|元数据|显着性

电影| WORK_OF_ART | {} | 0.7970062 Zoolander | WORK_OF_ART | {'mid'：'/ m / 01shy7'，'wikipedia_url'：'https://en.wikipedia.org/wiki/Zoolander'} | 0.20299383

Zoolander实体的显着性非常低，即使它是句子中最重要的实体......

有什么方法可以改善吗？或者是否有可以自定义的其他自然语言API？

2 个答案:

答案 0 :(得分：0)

我正在评估Google Cloud Natural Language，但找不到任何可自定义上下文的内容...所以看来不可能：（

答案 1 :(得分：0)

由于Google使用自己的数据来训练机器学习模型，因此无法改善API结果，并且没有自定义它的选项。

拥有自定义模型的唯一方法是自己进行训练，例如使用AutoML。但这需要很大的努力。

您可以根据上下文来提交feature request来“调整”结果（或者我可以为您做这件事），这可能以某种方式影响显着性得分，而不仅仅是考虑与文字。

无论如何，这可能不是必需的，因为我看到第一结果和第二结果之间存在重要的显着性差异。您是否尝试使用salience scores来代替salience absolute value？还是结果specific "types"的得分乘数（在这种情况下为WORK_OF_ART）？

我知道此解决方案可能适用于某些句子，但不适用于其他句子。