我试图用Java中的Stanford CoreNLP v3.9.1注释文本。 使用的注释器是:tokenize,ssplit,pos,lemma,ner
我已经加入了来自https://stanfordnlp.github.io/CoreNLP/download.html的模型jar。 两个英语模型都包含在我的项目中(正常+ kbp)。
但是,在加载english.muc.7class.distsim.crf.ser.gz
分类器后,会抛出以下异常:Couldn't read TokensRegexNER from edu/stanford/nlp/models/kbp/regexner_caseless.tab
。
打开下载jar模型stanford-english-kbp-corenlp-2018-02-27-models.jar
后,regexner_caseless.tab
的正确路径为edu/stanford/nlp/models/kbp/english/regexner_caseless.tab
(请注意english
子路径。)
如何让Stanford CoreNLP使用正确的路径?
答案 0 :(得分:5)
您缺少分发附带的主要型号jar。
stanford-corenlp-2018-02-27-models.jar