使用NER注释文本:例外:无法读取TokensRegexNER

时间:2018-03-31 01:37:24

标签: stanford-nlp

我试图用Java中的Stanford CoreNLP v3.9.1注释文本。 使用的注释器是:tokenize,ssplit,pos,lemma,ner

我已经加入了来自https://stanfordnlp.github.io/CoreNLP/download.html的模型jar。 两个英语模型都包含在我的项目中(正常+ kbp)。

但是,在加载english.muc.7class.distsim.crf.ser.gz分类器后,会抛出以下异常:Couldn't read TokensRegexNER from edu/stanford/nlp/models/kbp/regexner_caseless.tab

打开下载jar模型stanford-english-kbp-corenlp-2018-02-27-models.jar后,regexner_caseless.tab的正确路径为edu/stanford/nlp/models/kbp/english/regexner_caseless.tab(请注意english子路径。)

如何让Stanford CoreNLP使用正确的路径?

1 个答案:

答案 0 :(得分:5)

您缺少分发附带的主要型号jar。

stanford-corenlp-2018-02-27-models.jar