最好的交钥匙关系检测库?

时间:2011-01-19 07:18:45

标签: nlp chunking information-extraction

什么是最好的交钥匙(准备使用,工业强度)关系检测库?

我一直在玩NLTK,我得到的结果并不十分令人满意。

理想情况下,我想要一个可以使用以下句子的库:

“莎拉杀了一只正在吃小孩的狼”

并将其转换为数据结构,意思是:

杀死(莎拉,狼)和吃(狼,孩子)

我知道这是大量研究的主题,并不是一件容易的事。也就是说,是否有人知道一个相当强大的即用型库来检测关系?

2 个答案:

答案 0 :(得分:1)

更新:Extractiv已不再可用。

ExtractivOn-Demand REST服务: http://rest.extractiv.com/extractiv/?url=https://stackoverflow.com/questions/4732686/best-turnkey-relation-detection-library&output_format=html_viewer将处理此页面,在“GENERIC”下的左下角提取并显示您想要的两个semantic triples。 (它会在html查看器中丢弃页面中的一些文本,但如果您使用json或rdf输出,则不会抛弃此文本。)

这假设您对商业,工业强度解决方案持开放态度,但允许有限的免费使用。这是一项网络服务,但可以使用open source libraries来访问它,也可以从Language Computer Corporation购买。

答案 1 :(得分:1)

这些关系可以很容易地从依赖符号的输出中读出。例如,放入Stanford Parser online,您可以在类型依赖关系折叠表示中看到示例中的两个subject-verb-object三元组:

nsubj(killed-2, Sarah-1)
dobj(killed-2, wolf-4)

nsubj(eating-7, wolf-4)
dobj(eating-7, child-9)