尝试执行POStagging时出错:加载标记器模型时出错(可能缺少模型文件)

时间:2019-11-11 21:30:05

标签: stanford-nlp

我正在尝试使用Windows命令提示符将StanfordNLP用于克罗地亚语。我已经通过.pt文件下载了该语言的特定模型(hr_set_models)。

我已经创建了.properties文件,但收到以下消息:

线程“ main”中的异常edu.stanford.nlp.io.RuntimeIOException:加载标记器模型时出错(可能缺少模型文件)

令牌生成器模型没有问题,文件hr_set_tagger.pt位于文件夹中。

我看到在模型文件夹中还有一个名为hr_set.pretrain.pt的文件,我不知道是否应该在.properties文件中使用它。

提前谢谢!

下面是我创建的.properties文件。

annotators = tokenize, ssplit, pos, lemma, depparse
# tokenize
tokenize.model = hr_set_models/hr_set_tokenizer.pt
# pos
pos.model = hr_set_models/hr_set_tagger.pt
# lemma
lemma.model = hr_set_models/hr_set_lemmatizer.pt
#depparse
depparse.model = hr_set_models/hr_set_parser.pt

2 个答案:

答案 0 :(得分:0)

您需要使用完整的Python系统。克罗地亚语没有Java模型,因此您不应该使用Stanford CoreNLP服务器。

此处有更多文档:https://stanfordnlp.github.io/stanfordnlp/pipeline.html

答案 1 :(得分:0)

尝试使用

<dependencies>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
</dependency>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
    <classifier>models</classifier>
</dependency>
</dependencies>