没有任何配置或编码,哪些工具可以执行自动关系提取?

时间:2014-08-08 04:49:03

标签: nlp

我设计了一个系统来对特定的语料库进行自动关系提取,其中关系是事先不知道的。我想将我的系统与另一个automatic relation extraction系统进行比较,以查看我的系统是否表现得更好(对于学术论文)。我所知道的唯一这样的自动提取系统是混响。

reverb系统的自述文件中,他们说混响是“专为网络规模信息提取而设计的,目标关系不能提前指定,速度很重要。”我的系统比混响慢得多(我认为因为它解析句子并执行更深入的分析)所以我不确定比较是否有意义。我提取了更多关系,但比较有点不公平(因为我的系统计算密集程度更高)。还有其他类似混响的系统可以进行自动关系提取吗?也许那些不是“为网络规模信息提取而设计”的系统是更公平的竞争对手?

我知道NLTK会进行关系提取,但您必须提供特定的正则表达式粘合剂来绑定关系中的实体。

还有其他工具可供NLP从业者用来进行自动关系提取吗?

1 个答案:

答案 0 :(得分:6)

在NLP研究领域,提取关系而不指定您正在寻找的关系被称为"开放关系提取。"

有一些领先的系统可用于执行"开放关系提取"其中一些可用"开箱即用"

    来自华盛顿大学的
  • Reverb运行输入文本和输出关系
  • 来自马克斯普朗克研究所的
  • PATTY提供了一系列从纽约时报和维基百科中提取的大型实验。您可以下载关系(参见"下载"链接部分) - 然后在您的语料库中grep它们。请注意,某些关系包含了部分语音标记,因此要匹配这些关系,您需要在语料库中找到语音部分(使用一些标记器,如NLTK),然后查看它们是否与PATTY中的文本模式匹配。
  • 来自阿尔伯塔大学的
  • Exemplar

论文"开放式关系提取的有效性和效率"截至2013年秋季,Filipe Mesquita调查了一些尖端的关系提取系统。