这个问题与my question非常相似,但是由于SO的运作方式,我认为最好先提出一个新问题,而不是继续讨论。
CoreNLP具有Simple API,允许更快地访问NLP管道的各种组件。获取命名实体的方式似乎是:
nerTags()
来获取逐个令牌标记。通过上面的问题链接中讨论的其他机制,可以检索完整的多令牌实体提及,例如George Washington,这是一个由2个令牌组成的实体提及。有没有办法使用简单的api来获取这些多标记实体?
答案 0 :(得分:1)
是的,尽管它提供的信息少于完整的API,但只返回提及的字符串范围。请参阅Sentence#mentions(String)
和Sentence#mentions()
。
如果您想获得有关提及的更多信息,您必须使用常规API,或者在这些函数中重新实现逻辑。您也可以尝试在the raw Proto中进行搜索,这肯定会包含您可能想要的所有信息,但是在一个不太令人愉快的原型界面中。原型定义为here。