SpaCy如何制作其依赖关系树?

时间:2018-08-20 09:16:57

标签: tree dependencies spacy

我发现SpaCy具有创建依赖关系树的能力。例如,有一个问题“据称圣母玛利亚在1858年出现在法国卢尔德是谁?”

我们可以使用以下代码创建其依赖关系树:

appear is the root of this dependency tree

我知道这是一组边E,它代表G的特定分析的带标签的依存关系。更确切地说,边w_i,r,w_j⊂E代表头部w_i与被标记的w_j的依赖关系。与关系的类型。因此,依赖图G是S中令牌之间的一组依赖关系。

例如,我们展示了下面的依赖图  通过下图:

  • G =(V,E)
  • V = {它是法国卢尔德石窟的复制品,据说是圣母玛利亚,圣母玛利亚出现在圣伯纳黛特的地方……}
  • E = {(is,NSUBJ,It),(is,ATTR,一个副本),(一个副本,PREP,of),...}

但是我想知道Spacy是如何制造E的?依赖树方法如何选择哪个节点是根节点,哪个不是根节点?

我从this French paper听说,一方面,E⊆V x R x V其中R = {r_1,...,r_m}是一组有限的依赖关系可能名称,我们称之为依赖关系关系。他们可以在一个句子中链接两个标记。依赖项名称r⊂R也称为标记边。例如,可以用r = SBJ记录动词与其主语之间的关系。

另一方面,这是一个分析问题,即找到输入句子得分最高的依存关系图。

但是我还没有看到有儿童订购的地方。


上下文是,我正在使用SpaCy依赖关系树来获取段落句子的词根并将其与问题的词根匹配。

对于上述问题,我们必须在以下段落中找到答案:

  

上下文—”建筑学上,学校具有天主教的性质。在顶上   主楼的金色圆顶是圣母玛利亚的金色雕像。   紧挨着主楼并面对它的是铜   传说中的“ Venite Ad Me”举起双手的基督雕像   欧姆尼斯”。主楼旁边是圣心大教堂。   紧靠大教堂的是石窟,是玛丽安的地方   祈祷与反思。它是卢尔德石窟的复制品,   据说圣母玛利亚出现在法国的圣贝纳黛特   1858年令人ubi目结舌。在主驱动器的末尾(和直线上)   通过三个雕像和金顶相连),很简单,   玛丽的现代石像。”

期望的答案是“圣伯纳黛特·苏比鲁斯” 。 带有答案的句子是“它是法国卢尔德石窟的复制品,据说圣母玛利亚于1858年出现在Saint Bernadette Soubirous。” 。包含答案的句子的依存关系树是:

enter image description here

我最初发布了这个问题on Computer Science SE,但没有成功。

0 个答案:

没有答案