我们正在编写一个演示应用,其中我们使用了Google的云语音API和自然语言API。 我们将它用于电视机和机顶盒中的语音控制。
总的来说,我必须说API工作得很好。
但是,我们想知道是否可以自定义Natural Language API,以便在我们的行业中更具体。
更具体地说,我们遇到了传递给特定实体的显着性分数的问题。
E.g。 将以下文本数据传递到Google Cloud API: “给我看看像Zoolander这样的电影。”
给我们以下结果:
实体名称|实体类型|元数据|显着性
电影| WORK_OF_ART | {} | 0.7970062 Zoolander | WORK_OF_ART | {'mid':'/ m / 01shy7','wikipedia_url':'https://en.wikipedia.org/wiki/Zoolander'} | 0.20299383
Zoolander实体的显着性非常低,即使它是句子中最重要的实体......
有什么方法可以改善吗? 或者是否有可以自定义的其他自然语言API?
答案 0 :(得分:0)
我正在评估Google Cloud Natural Language,但找不到任何可自定义上下文的内容...所以看来不可能:(
答案 1 :(得分:0)
由于Google使用自己的数据来训练机器学习模型,因此无法改善API结果,并且没有自定义它的选项。
拥有自定义模型的唯一方法是自己进行训练,例如使用AutoML。但这需要很大的努力。
您可以根据上下文来提交feature request来“调整”结果(或者我可以为您做这件事),这可能以某种方式影响显着性得分,而不仅仅是考虑与文字。
无论如何,这可能不是必需的,因为我看到第一结果和第二结果之间存在重要的显着性差异。您是否尝试使用salience scores
来代替salience absolute value
?还是结果specific "types"的得分乘数(在这种情况下为WORK_OF_ART
)?
我知道此解决方案可能适用于某些句子,但不适用于其他句子。