核心nlp演示和解析器演示之间的POS标记结果不一致

时间:2018-02-23 01:26:07

标签: stanford-nlp

之间的POS标记结果不一致

P:http://nlp.stanford.edu:8080/parser/

C:http://nlp.stanford.edu:8080/corenlp/process

如,

C:我们去了东/ JJ到奥斯陆。 P:我们去了东/ RB到奥斯陆。

C:我们都是/ DT变老了。 P:我们都是/ RB变老了。

C:你对假期感到兴奋/ VBN吗? 警:你对你的假期感到兴奋/ JJ?

C:你做过/ VBP吗? P:你做过VB吗?

似乎解析器的性能优于核心nlp,但我无法通过在核心nlp zip文件中提供的模型之间切换来复制解析器结果。

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

如果您使用这些不同的管道,您将获得不同的词性标记结果:

tokenize,ssplit,pos,lemma,parse

VS

tokenize,ssplit,parse

后者将执行部分语音标记作为解析过程的一部分。前者使用专用于词性标注的MEMM序列标记模型。