如何使用Java使用Stanford NLP工具生成通用依赖关系?

时间:2015-12-14 10:51:59

标签: java nlp stanford-nlp

我们使用以下命令从命令行创建了解析树:

java -mx1g -cp "*" edu.stanford.nlp.parser.lexparser.LexicalizedParser -sentences newline -tokenized -tagSeparator / -tokenizerFactory edu.stanford.nlp.process.WhitespaceTokenizer -tokenizerMethod newCoreLabelTokenizerFactory edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz data/for.txt

并且我们得到输入文件的正确输出为树格式。

但我们希望输出如:http://nlp.stanford.edu:8080/parser/

普遍依赖 nmod:poss(dog-2,My-1) nsubj(喜欢-4,狗-2) advmod(like-4,also-3) root(ROOT-0,like-4) xcomp(喜欢-4,吃-5) dobj(吃-5,香肠-6) 通用依赖项,增强 nmod:poss(dog-2,My-1) nsubj(喜欢-4,狗-2) advmod(like-4,also-3) root(ROOT-0,like-4) xcomp(喜欢-4,吃-5) dobj(吃-5,香肠-6)

请分享JAVA代码以产生此输出。

1 个答案:

答案 0 :(得分:1)

  1. 从这里下载Stanford CoreNLP 3.6.0:http://stanfordnlp.github.io/CoreNLP

  2. 从刚刚下载的目录中运行此命令:

    java -Xmx3g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,depparse -file sample_text.txt -outputFormat text