Question

我的文本可以包含多个命名实体（例如，一个人和两个组织）。我需要根据命名实体塔格的置信度选择其中一种文本。（最后的示例）

该项目使用“ analyzeEntities” details here标记命名实体。如何获得每个标记实体的置信度？

示例： 将文本设为“ Homes和Joshua是StackOverflow的两名雇员。”

让我们假设标记器具有以下置信度：

Homes -> PERSON -> 0.3
Joshua -> PERSON -> 0.7
StackOverflow -> ORGANIZATION -> 0.4

我需要选择“约书亚”，因为该实体具有最高的置信度得分。一种方法是从服务API获得置信度分数以及返回的内容。我怎样才能做到这一点？有什么办法可以得到像上面那样的分数？

PS：我使用Python 3.x，但也欢迎使用其他语言的解决方案。

Answer 1

当前，API并未公开任何实体预测的置信度。它会产生一个“显着性”评分，该评分将评分与每个实体相关联，以表明它们在文本中的重要性，而不会与表明模型对该预测有多自信的信心相混淆。