我有兴趣从问题中提取三元组(主语,谓词,宾语)。
例如,我想转换以下问题:
谁是美国总统的妻子?
到:
(x,isWifeOf,y)∧(y,isPresidentof,USA)
x和y是unknows我们必须找到以回答问题(/ \表示连接)。
我已经阅读了很多关于这个主题的论文,我想使用现有的解析器(如Stanford解析器)来执行此任务。我知道解析器输出两种类型的数据:
有些论文试图从解析结构树中构建三元组(例如Triple Extraction from Sentences),但这种方法似乎太弱而无法处理复杂的问题。
另一方面,依赖树包含许多相关信息来执行三次提取。很多论文声称这样做,但是我没有找到任何明确给出详细程序或算法的论文。大多数时候,作者说他们根据他们没有给出的一些规则来分析产生三元组的依赖关系。
有没有人知道任何有关从问题的依赖关系树中提取(主题,谓词,对象)的更多信息的论文?
答案 0 :(得分:0)
Textacy具有不错的三重提取实现。它建立在SpaCy(Python中流行的NLP库)的基础上。您似乎对三重提取的基础算法特别感兴趣,因此,研究其算法的源代码可能会给您带来一些启发。看到这里:https://textacy.readthedocs.io/en/stable/_modules/textacy/extract.html#subject_verb_object_triples