我需要从作为Stanford Parser中的lexalized解析输出而生成的依赖关系解析树中提取NP-VP-NP
形式的三元组。
这是最好的方法。 例如如果解析树如下:
(ROOT
(S
(S
(NP (NNP Exercise))
(VP (VBZ reduces)
(NP (NN stress)))
(. .))
(NP (JJ Regular) (NN exercise))
(VP (VBZ maintains)
(NP (JJ mental) (NN fitness)))
(. .)))
我需要提取2个三元组:
有什么想法吗?
答案 0 :(得分:3)
这里有两种自然选择。一种是在依赖树上运行Semgrex(旁注:你在问题中所拥有的是一个选区树),其模式如下:
{pos:/V.*/}=verb >/.subj.*/ {}=subject >/.obj/ {}=object
另一种选择是使用Stanford Open IE系统。这将为您提供更广泛的语义(主题;关系;对象)'三元组,其关系不一定是动词。