之间的POS标记结果不一致
P:http://nlp.stanford.edu:8080/parser/
和
C:http://nlp.stanford.edu:8080/corenlp/process
如,
C:我们去了东/ JJ到奥斯陆。 P:我们去了东/ RB到奥斯陆。 C:我们都是/ DT变老了。 P:我们都是/ RB变老了。 C:你对假期感到兴奋/ VBN吗? 警:你对你的假期感到兴奋/ JJ? C:你做过/ VBP吗? P:你做过VB吗?似乎解析器的性能优于核心nlp,但我无法通过在核心nlp zip文件中提供的模型之间切换来复制解析器结果。
有什么想法吗?
答案 0 :(得分:0)
如果您使用这些不同的管道,您将获得不同的词性标记结果:
tokenize,ssplit,pos,lemma,parse
VS
tokenize,ssplit,parse
后者将执行部分语音标记作为解析过程的一部分。前者使用专用于词性标注的MEMM序列标记模型。