Question

Stanford parser online给出的类型依赖项和给定源代码生成的依赖项不相同。

斯坦福网站上提供的源代码版本不会生成缩写，所有格和poss标签。

使用哪个版本的Stanford解析器生成这些标记？

Answer 1

他们是一样的。答案是你必须以一种会导致输入标记化的方式调用解析器。一些例子是：

LexicalizedParser lp = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
String sent = "This is one last test!";
lp.apply(sent).pennPrint();

或更复杂的情况：

TreebankLanguagePack tlp = lp.getOp().langpack();
Tokenizer<? extends HasWord> toke = tlp.getTokenizerFactory().getTokenizer(new StringReader(sent));
List<? extends HasWord> sentence = toke.tokenize();
lp.apply(sentence);

Stanford解析器的类型依赖项

1 个答案: