应用错误收集

StanfordCoreNLP：为什么两种不同的数据结构为缺点。解析和依赖解析？

时间：2015-02-10 15:39:10

标签： nlp stanford-nlp

为什么选择Stanford：CoreNLP正在使用不同的数据结构来表示其树（例如，使用＆＃39; BasicDependenciesAnnotation＆＃39;以及＃tree树和＃39; TreeAnnotation＆＃39;）。看起来这些注释可以用相同的数据结构表示（比如带有标签的DAG）。是否有任何机制将这些相互投射？（至少对他们中的一些人来说）

LINK：http://nlp.stanford.edu/software/corenlp.shtml

1 个答案:

答案 0 :(得分：2)

折叠后的依赖关系解析不一定是DAG。来自Stanford Dependencies manual：

折叠和CCprocessed依赖项不是DAG。图形可以包含两个节点之间的小循环（仅）。鉴于目前的代表性选择，这些似乎并不可取消。它们出现在相关条款中，例如介绍你的女人。一旦您希望代表谁的指示对象，就会出现这些周期。在basic plus extras表示中，您获得rcmod(woman, introduced)，nsubj(introduced, who)和ref(woman, who)。在折叠过程中，ref弧被折叠，因此有两个节点周期：rcmod(woman, introduced)和nsubj(introduced, woman)。