让我们考虑以下文本:
“约翰·约瑟夫(John Joseph)居住在美国。他在联邦政府工作”
我得到以下文本提及的实体:
John Joseph
America
He
Federal government
现在,我正在尝试获取每个提及的实体的概率值。当我查看Java APIs
时,我注意到我们可以获得每个令牌(约翰,约瑟夫,美国,他,联邦政府和政府机构)的概率值。
但是,我们如何获得“约翰·约瑟夫”和“联邦政府”(一个以上的代币)的概率值?有没有可用的Java API来获取此值?
任何帮助将不胜感激。
答案 0 :(得分:0)
我们将在Stanford CoreNLP 3.9.2中添加一个新功能,该功能附加了实体的最小标记标签概率。但是,对于通过规则得出的任何结果,我们都不会提供任何分数,因为尚不清楚哪种置信度合适。因此,例如“ Joe Smith”可能会获得“ Joe”令牌具有PERSON的概率。这似乎是一种合理的探索。
我们的目标是在本月底之前发布此新版本!发布后,我将用更多详细信息更新此答案。