StanfordCoreNLP:为什么两种不同的数据结构为缺点。解析和依赖解析?

时间:2015-02-10 15:39:10

标签: nlp stanford-nlp

为什么选择Stanford:CoreNLP正在使用不同的数据结构来表示其树(例如,使用' BasicDependenciesAnnotation'以及#tree树和#39; TreeAnnotation')。 看起来这些注释可以用相同的数据结构表示(比如带有标签的DAG)。是否有任何机制将这些相互投射? (至少对他们中的一些人来说)

LINK:http://nlp.stanford.edu/software/corenlp.shtml

1 个答案:

答案 0 :(得分:2)

折叠后的依赖关系解析不一定是DAG。来自Stanford Dependencies manual

  

折叠和CCprocessed依赖项不是DAG。图形可以包含两个节点之间的小循环(仅)。鉴于目前的代表性选择,这些似乎并不可取消。它们出现在相关条款中,例如介绍你的女人。一旦您希望代表的指示对象,就会出现这些周期。在basic plus extras表示中,您获得rcmod(woman, introduced)nsubj(introduced, who)ref(woman, who)。在折叠过程中,ref弧被折叠,因此有两个节点周期:rcmod(woman, introduced)nsubj(introduced, woman)