Question

这个问题类似于Can I get an entityMention from the result of a TokensRegex match in Stanford CoreNLP?

我有一组TokensRegex规则，它们使用与标准“ LOCATION”，“ PERSON”等不同的标签来标记令牌。

entitymentions注释器对于多令牌命名实体非常有用。如何为由regexner注释者标记的令牌序列建立实体化？它们似乎不是使用标准设置构建的。

我正在通过http API使用CoreNLP 3.9.2

感谢您的帮助

Answer 1

这是示例命令

java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.additional.tokensregex.rules example.rules -file example.txt -outputFormat text

更多信息... ner注释器将执行一系列步骤

统计专家
数字序列和SUTime
细粒度的NER（例如：LOCATION-> STATE_OR_PROVINCE）
其他令牌RegexNER规则
其他令牌正则表达式规则
实体建设

因此，在执行步骤1-5之后，将构建实体，并从TokensRegex规则中看到标记。

这是当前的GitHub代码和版本3.9.2（不适用于旧版本）。

此处有更多信息：https://stanfordnlp.github.io/CoreNLP/ner.html

如何从由Regexner注释器标记的令牌构建实体化？

1 个答案: