如何获取所有提及的实体的概率值

时间:2018-09-12 16:41:29

标签: stanford-nlp

让我们考虑以下文本:

  

“约翰·约瑟夫(John Joseph)居住在美国。他在联邦政府工作”

我得到以下文本提及的实体:

  1. John Joseph
  2. America
  3. He
  4. Federal government

现在,我正在尝试获取每个提及的实体的概率值。当我查看Java APIs时,我注意到我们可以获得每个令牌(约翰,约瑟夫,美国,他,联邦政府和政府机构)的概率值。

但是,我们如何获得“约翰·约瑟夫”和“联邦政府”(一个以上的代币)的概率值?有没有可用的Java API来获取此值?

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

我们将在Stanford CoreNLP 3.9.2中添加一个新功能,该功能附加了实体的最小标记标签概率。但是,对于通过规则得出的任何结果,我们都不会提供任何分数,因为尚不清楚哪种置信度合适。因此,例如“ Joe Smith”可能会获得“ Joe”令牌具有PERSON的概率。这似乎是一种合理的探索。

我们的目标是在本月底之前发布此新版本!发布后,我将用更多详细信息更新此答案。