使用Stanford CoreNLP中的Simple API,有没有办法获得多令牌实体?

时间:2018-05-25 12:52:40

标签: stanford-nlp

这个问题与my question非常相似,但是由于SO的运作方式,我认为最好先提出一个新问题,而不是继续讨论。

CoreNLP具有Simple API,允许更快地访问NLP管道的各种组件。获取命名实体的方式似乎是:

  1. 从文本
  2. 中形成文档注释
  3. 从文档对象中获取句子
  4. 使用句子对象中的nerTags()来获取逐个令牌标记。
  5. 通过上面的问题链接中讨论的其他机制,可以检索完整的多令牌实体提及,例如George Washington,这是一个由2个令牌组成的实体提及。有没有办法使用简单的api来获取这些多标记实体?

1 个答案:

答案 0 :(得分:1)

是的,尽管它提供的信息少于完整的API,但只返回提及的字符串范围。请参阅Sentence#mentions(String)Sentence#mentions()

如果您想获得有关提及的更多信息,您必须使用常规API,或者在这些函数中重新实现逻辑。您也可以尝试在the raw Proto中进行搜索,这肯定会包含您可能想要的所有信息,但是在一个不太令人愉快的原型界面中。原型定义为here