是否可以在DBPedia中检索三重源数据集?

时间:2014-08-19 13:48:21

标签: rdf sparql dbpedia

假设我查询了像this这样的DBPedia:

select * where
{
  ?x ?y ?z .
  filter (?x = <http://dbpedia.org/resource/Abracadabra>)
}
结果得到了很多三倍:

x   y   z  
http://dbpedia.org/resource/Abracadabra     http://www.w3.org/2002/07/owl#sameAs    http://de.dbpedia.org/resource/Abrakadabra  
http://dbpedia.org/resource/Abracadabra     http://www.w3.org/2002/07/owl#sameAs    http://fr.dbpedia.org/resource/Abracadabra  
http://dbpedia.org/resource/Abracadabra     http://www.w3.org/2002/07/owl#sameAs    http://ko.dbpedia.org/resource/아브라카다브라  
...

是否有可能检测到每个三联的these datasets中的哪一个来自? 我想在本地下载并使用其中一些数据集,但首先我必须根据它们包含的三元组找出哪些对我有用。

在最糟糕的情况下,我想知道哪些数据集包含rdfs:labels。

P.S。 This方法不起作用,?g总是http://dbpedia.org

1 个答案:

答案 0 :(得分:3)

您链接到的商家信息中的目录中,我认为您想要下拉data from the English Wikipedia。也就是说,那里仍然有很多文件。 The DBpedia Data Set (3.9)提供了有关可下载的不同文件的详细信息。也许最重要的是,它说:

  

查找不同DBpedia数据集here中使用的属性。

该链接将您带到DBpedia 3.9 Data Set Properties,我会回答您,哪些属性在哪些数据集中。为了特别回答“最坏情况”,它说rdfs:label值存储在Titles数据集中。即使他们称之为标题,我认为这是你会发现的

labels_en.nq.bz2
labels_en.nt.bz2
labels_en.tql.bz2
labels_en.ttl.bz2 
您链接到的商家信息中的

。我不知道是否有办法自动查找数据集。如果DBpedia 3.9 Data Set Properties中的表在某处被编码并且可以被查询,那将是很好的,因为这样很容易。