在哪里可以找到最先进的关系提取数据集

时间:2015-04-12 16:05:38

标签: nlp

我正在寻找一个包含大量关系元组的数据集。例如,搜索“人”和“位置”会产生“生活”,“工作”等。华盛顿大学的OpenIE http://OpenIE.cs.washington.edu是一个很好的工具,但他们的数据集只能通过网络访问。我在哪里可以下载这样的数据库或库?

2 个答案:

答案 0 :(得分:3)

  1. OpenIE本身为此目的提供了11 gb的大型数据集。看看这个
  2. http://knowitall.cs.washington.edu/paralex/

    虽然它是一个自动应答系统,但您可以考虑中间关系提取结果。

    1. 您可以实现的另一种方法是使用syntex parse。使用syntex解析器和编写规则,根据您的要求提取主题,对象和其他实体。

答案 1 :(得分:2)

我一直在收集包含命名实体或名词之间关系的所有公共数据集。

你可以在这里找到它们:

https://github.com/davidsbatista/Annotated-Semantic-Relationships-Datasets