Stanford解析器的类型依赖项

时间:2010-09-26 09:26:54

标签: java parsing stanford-nlp

Stanford parser online给出的类型依赖项和给定源代码生成的依赖项不相同。

斯坦福网站上提供的源代码版本不会生成缩写,所有格和poss标签。

使用哪个版本的Stanford解析器生成这些标记?

1 个答案:

答案 0 :(得分:4)

他们是一样的。答案是你必须以一种会导致输入标记化的方式调用解析器。一些例子是:

LexicalizedParser lp = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
String sent = "This is one last test!";
lp.apply(sent).pennPrint();

或更复杂的情况:

TreebankLanguagePack tlp = lp.getOp().langpack();
Tokenizer<? extends HasWord> toke = tlp.getTokenizerFactory().getTokenizer(new StringReader(sent));
List<? extends HasWord> sentence = toke.tokenize();
lp.apply(sentence);