提取三元组主语,谓词和宾语句子

时间:2011-11-09 10:05:54

标签: nlp

我正试图从句子中提取三元组主语,谓语和宾语。 我需要更多关于如何做到这一点的参考资料。

3 个答案:

答案 0 :(得分:13)

执行此操作的最基本方法,可接受的结果是进行浅层解析,然后提取NOUN-VERB-NOUN三元组。这适用于所有SVO(subject-verb-object)语言,如英语。可能需要一些调整才能从句子中提取第一个三元组,或者在昏迷的情况下不提取。这是一个非常快速的解决方案,因为浅的POS标记通常是每句话O(n) - 0.01,而不是深度解析(Open NLP,Stanford Parser),即O(n ^ 3) - 每句话0.4秒。

答案 1 :(得分:8)

您可以使用Stanford parser APIOpen NLP 进行部分语音标记和其他一些NLP操作

对于三元组提取,您可以在互联网上提供的论文中实现其中一种技术,我知道这是一个很好的实现方法:http://ailab.ijs.si/delia_rusu/Papers/is_2007.pdf

答案 2 :(得分:1)

我正在研究类似的问题,我正在使用visual basic。 首先:我有一个主题/ NOUNS列表 其次:当我提取谓词时,我提取短语之间......

(一只猫)(周六)(垫子)

通过使用名词和名词短语构建主题列表,其位置可以替换为(学习模式) 然后,如果未检测到对象,则可能先前已检测到所学习的谓词。

也许这类似于雪球算法。