如何从由Regexner注释器标记的令牌构建实体化?

时间:2018-10-25 20:53:06

标签: stanford-nlp

这个问题类似于Can I get an entityMention from the result of a TokensRegex match in Stanford CoreNLP?

我有一组TokensRegex规则,它们使用与标准“ LOCATION”,“ PERSON”等不同的标签来标记令牌。

entitymentions注释器对于多令牌命名实体非常有用。如何为由regexner注释者标记的令牌序列建立实体化?它们似乎不是使用标准设置构建的。

我正在通过http API使用CoreNLP 3.9.2

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

这是示例命令

java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.additional.tokensregex.rules example.rules -file example.txt -outputFormat text

更多信息... ner注释器将执行一系列步骤

  1. 统计专家
  2. 数字序列和SUTime
  3. 细粒度的NER(例如:LOCATION-> STATE_OR_PROVINCE)
  4. 其他令牌RegexNER规则
  5. 其他令牌正则表达式规则
  6. 实体建设

因此,在执行步骤1-5之后,将构建实体,并从TokensRegex规则中看到标记。

这是当前的GitHub代码和版本3.9.2(不适用于旧版本)。

此处有更多信息:https://stanfordnlp.github.io/CoreNLP/ner.html