我们使用以下命令从命令行创建了解析树:
java -mx1g -cp "*" edu.stanford.nlp.parser.lexparser.LexicalizedParser -sentences newline -tokenized -tagSeparator / -tokenizerFactory edu.stanford.nlp.process.WhitespaceTokenizer -tokenizerMethod newCoreLabelTokenizerFactory edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz data/for.txt
并且我们得到输入文件的正确输出为树格式。
但我们希望输出如:http://nlp.stanford.edu:8080/parser/
普遍依赖 nmod:poss(dog-2,My-1) nsubj(喜欢-4,狗-2) advmod(like-4,also-3) root(ROOT-0,like-4) xcomp(喜欢-4,吃-5) dobj(吃-5,香肠-6) 通用依赖项,增强 nmod:poss(dog-2,My-1) nsubj(喜欢-4,狗-2) advmod(like-4,also-3) root(ROOT-0,like-4) xcomp(喜欢-4,吃-5) dobj(吃-5,香肠-6)
请分享JAVA代码以产生此输出。
答案 0 :(得分:1)
从这里下载Stanford CoreNLP 3.6.0:http://stanfordnlp.github.io/CoreNLP
从刚刚下载的目录中运行此命令:
java -Xmx3g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,depparse -file sample_text.txt -outputFormat text