从斯坦福依赖解析树中提取NP-VP-NP

时间:2015-11-16 10:56:10

标签: nlp stanford-nlp opennlp

我需要从作为Stanford Parser中的lexalized解析输出而生成的依赖关系解析树中提取NP-VP-NP形式的三元组。

这是最好的方法。 例如如果解析树如下:

(ROOT
  (S
    (S
      (NP (NNP Exercise))
      (VP (VBZ reduces)
        (NP (NN stress)))
      (. .))
    (NP (JJ Regular) (NN exercise))
    (VP (VBZ maintains)
      (NP (JJ mental) (NN fitness)))
    (. .)))

我需要提取2个三元组:

  1. 锻炼 - 减轻压力和
  2. 经常锻炼 - 保持心理健康
  3. 有什么想法吗?

1 个答案:

答案 0 :(得分:3)

这里有两种自然选择。一种是在依赖树上运行Semgrex(旁注:你在问题中所拥有的是一个选区树),其模式如下:

{pos:/V.*/}=verb >/.subj.*/ {}=subject >/.obj/ {}=object

另一种选择是使用Stanford Open IE系统。这将为您提供更广泛的语义(主题;关系;对象)'三元组,其关系不一定是动词。