如何重现Stanford NLP标记演示页面?

时间:2018-03-25 11:46:16

标签: nlp stanford-nlp

我想重现此处显示的POS标记:

http://nlp.stanford.edu:8080/parser/index.jsp

他们说他们使用的是englishPCFG.ser.gz解析器,但未指定他们使用哪个标记器以及其他属性。

那么我应该运行哪个命令行来复制演示页面的相同标记?目前我使用:

java -Xmx500m -cp "*:/models/stanford-english-corenlp-2018-02-27-models.jar" edu.stanford.nlp.pipeline.StanfordCoreNLPServer  -annotators tokenize,ssplit,pos -port 9001 -timeout 15000

2 个答案:

答案 0 :(得分:0)

java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,parse -file example.txt -outputFormat text

如果您没有指定词性模型,parser注释器将使用解析算法生成词性标注。

答案 1 :(得分:0)

解决方案是添加服务器属性(可以在属性文件中完成):

ctrl+build