sentenceDelimiter选项在使用斯坦福nndep解析器期间不起作用。
命令是
java -classpath stanford-parsing -mx2000m \
edu.stanford.nlp.parser.nndep.DependencyParser \
-model nndep/english_UD.gz \
-outputFormatOptions includePunctuationDependencies \
-tagger.model stanford-postags/models/english-left3words-distsim.tagger \
-textFile srcinput.txt \
-outFile srcinput.dependence \
-sentenceDelimiter newline
解析器无法拆分句子。 如果-sentenceDelimiter的值为$'\ n',则该命令可能会起作用,但如果在linux中使用具有setid的命令运行该命令则会失败。
答案 0 :(得分:0)
我建议只运行完整的Stanford CoreNLP下载管道。
您可以在此处获取完整的软件包:https://stanfordnlp.github.io/CoreNLP/
示例命令:
java -Xmx4g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,depparse -ssplit.eolonly -file example.txt