我的文本可以包含多个命名实体(例如,一个人和两个组织)。 我需要根据命名实体塔格的置信度选择其中一种文本。 (最后的示例)
该项目使用“ analyzeEntities” details here标记命名实体。如何获得每个标记实体的置信度?
示例: 将文本设为“ Homes和Joshua是StackOverflow的两名雇员。”
让我们假设标记器具有以下置信度:
Homes -> PERSON -> 0.3
Joshua -> PERSON -> 0.7
StackOverflow -> ORGANIZATION -> 0.4
我需要选择“约书亚”,因为该实体具有最高的置信度得分。 一种方法是从服务API获得置信度分数以及返回的内容。我怎样才能做到这一点?有什么办法可以得到像上面那样的分数?
PS:我使用Python 3.x,但也欢迎使用其他语言的解决方案。
答案 0 :(得分:0)
当前,API并未公开任何实体预测的置信度。它会产生一个“显着性”评分,该评分将评分与每个实体相关联,以表明它们在文本中的重要性,而不会与表明模型对该预测有多自信的信心相混淆。