这个问题类似于Can I get an entityMention from the result of a TokensRegex match in Stanford CoreNLP?
我有一组TokensRegex规则,它们使用与标准“ LOCATION”,“ PERSON”等不同的标签来标记令牌。
entitymentions
注释器对于多令牌命名实体非常有用。如何为由regexner
注释者标记的令牌序列建立实体化?它们似乎不是使用标准设置构建的。
我正在通过http API使用CoreNLP 3.9.2
感谢您的帮助
答案 0 :(得分:0)
这是示例命令
java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.additional.tokensregex.rules example.rules -file example.txt -outputFormat text
更多信息... ner
注释器将执行一系列步骤
因此,在执行步骤1-5之后,将构建实体,并从TokensRegex规则中看到标记。
这是当前的GitHub代码和版本3.9.2(不适用于旧版本)。