使用不受支持的语言的Stanford CoreNLP依赖性分析器使用情况

时间:2017-11-02 15:47:05

标签: nlp stanford-nlp dependency-parsing

我正在尝试用土耳其语训练CoreNLP的基于NN的依赖解析器。我在解析器的文档中找到了以下命令:

Train a parser with CoNLL treebank data: java    edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath
-devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz

我无法弄清楚modelOutputFile是什么。文档中声明该文件是在培训阶段编写的。 modelOutputFile是我应该创建的预生成文件,还是只是在训练阶段自动写入的空文件?

任何帮助将不胜感激,谢谢!

1 个答案:

答案 0 :(得分:1)

当训练过程完成后,它应该将训练过的模型写入modelOutputFile.txt.gz然后您可以使用该训练文件来解析新文本。完整文档:https://nlp.stanford.edu/software/nndep.shtml