我正在尝试使用Windows命令提示符将StanfordNLP用于克罗地亚语。我已经通过.pt文件下载了该语言的特定模型(hr_set_models)。
我已经创建了.properties文件,但收到以下消息:
线程“ main”中的异常edu.stanford.nlp.io.RuntimeIOException:加载标记器模型时出错(可能缺少模型文件)
令牌生成器模型没有问题,文件hr_set_tagger.pt位于文件夹中。
我看到在模型文件夹中还有一个名为hr_set.pretrain.pt的文件,我不知道是否应该在.properties文件中使用它。
提前谢谢!
下面是我创建的.properties文件。
annotators = tokenize, ssplit, pos, lemma, depparse
# tokenize
tokenize.model = hr_set_models/hr_set_tokenizer.pt
# pos
pos.model = hr_set_models/hr_set_tagger.pt
# lemma
lemma.model = hr_set_models/hr_set_lemmatizer.pt
#depparse
depparse.model = hr_set_models/hr_set_parser.pt
答案 0 :(得分:0)
您需要使用完整的Python系统。克罗地亚语没有Java模型,因此您不应该使用Stanford CoreNLP服务器。
此处有更多文档:https://stanfordnlp.github.io/stanfordnlp/pipeline.html
答案 1 :(得分:0)
尝试使用
<dependencies>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
</dependency>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
<classifier>models</classifier>
</dependency>
</dependencies>