Question

我正在尝试使用Windows命令提示符将StanfordNLP用于克罗地亚语。我已经通过.pt文件下载了该语言的特定模型（hr_set_models）。

我已经创建了.properties文件，但收到以下消息：

线程“ main”中的异常edu.stanford.nlp.io.RuntimeIOException：加载标记器模型时出错（可能缺少模型文件）

令牌生成器模型没有问题，文件hr_set_tagger.pt位于文件夹中。

我看到在模型文件夹中还有一个名为hr_set.pretrain.pt的文件，我不知道是否应该在.properties文件中使用它。

提前谢谢！

下面是我创建的.properties文件。

annotators = tokenize, ssplit, pos, lemma, depparse
# tokenize
tokenize.model = hr_set_models/hr_set_tokenizer.pt
# pos
pos.model = hr_set_models/hr_set_tagger.pt
# lemma
lemma.model = hr_set_models/hr_set_lemmatizer.pt
#depparse
depparse.model = hr_set_models/hr_set_parser.pt

Answer 1

您需要使用完整的Python系统。克罗地亚语没有Java模型，因此您不应该使用Stanford CoreNLP服务器。

此处有更多文档：https://stanfordnlp.github.io/stanfordnlp/pipeline.html

Answer 2

尝试使用

<dependencies>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
</dependency>
<dependency>
    <groupId>edu.stanford.nlp</groupId>
    <artifactId>stanford-corenlp</artifactId>
    <version>3.6.0</version>
    <classifier>models</classifier>
</dependency>
</dependencies>

尝试执行POStagging时出错：加载标记器模型时出错（可能缺少模型文件）

2 个答案: