自然语言解析器(例如Stanford parser)输出句子的句法树,也许输出POS标记的单词列表和依赖项列表。例如:
Bell总部位于洛杉矶,生产和销售电子产品,计算机和建筑产品。
斯坦福解析器correctly infers," 的主题"是" 贝尔"对象是" 产品"而" 电子"," 计算机"," 建设&#34 ;是" 产品的所有修饰符"。与" 分发"类似。一个自然的下一步是使用这些信息来构建这样的关系列表:
......还有几个。更一般地说,我想要一个表格关系列表:
主题 - 行动 - 对象
为了具体起见,我们假设动作只能是单个动词,主语 - 名词和对象 - 带有可选形容词的名词。显然,从解析的句子到一组这样的关系的转换将是有损的,但是结果比原始的句法树更容易进一步加工机器。我知道如何在看到解析的句子时手动提取这些关系,这个问题问:如何自动执行此操作?是否有一个已知的算法可以做类似的事情?如果没有,我应该如何建立一个?
我没有要求解析器推荐,这是一个解析之上的任务。这个任务在我看来
因此我想象人们已经多次这样做了。不幸的是,我无法找到任何接近的东西。