假设我查询了像this这样的DBPedia:
select * where
{
?x ?y ?z .
filter (?x = <http://dbpedia.org/resource/Abracadabra>)
}
结果得到了很多三倍:
x y z
http://dbpedia.org/resource/Abracadabra http://www.w3.org/2002/07/owl#sameAs http://de.dbpedia.org/resource/Abrakadabra
http://dbpedia.org/resource/Abracadabra http://www.w3.org/2002/07/owl#sameAs http://fr.dbpedia.org/resource/Abracadabra
http://dbpedia.org/resource/Abracadabra http://www.w3.org/2002/07/owl#sameAs http://ko.dbpedia.org/resource/아브라카다브라
...
是否有可能检测到每个三联的these datasets中的哪一个来自? 我想在本地下载并使用其中一些数据集,但首先我必须根据它们包含的三元组找出哪些对我有用。
在最糟糕的情况下,我想知道哪些数据集包含rdfs:labels。
P.S。 This方法不起作用,?g总是http://dbpedia.org
答案 0 :(得分:3)
您链接到的商家信息中的目录中,我认为您想要下拉data from the English Wikipedia。也就是说,那里仍然有很多文件。 The DBpedia Data Set (3.9)提供了有关可下载的不同文件的详细信息。也许最重要的是,它说:
查找不同DBpedia数据集here中使用的属性。
该链接将您带到DBpedia 3.9 Data Set Properties,我会回答您,哪些属性在哪些数据集中。为了特别回答“最坏情况”,它说rdfs:label值存储在Titles数据集中。即使他们称之为标题,我认为这是你会发现的
labels_en.nq.bz2
labels_en.nt.bz2
labels_en.tql.bz2
labels_en.ttl.bz2
您链接到的商家信息中的。我不知道是否有办法自动查找数据集。如果DBpedia 3.9 Data Set Properties中的表在某处被编码并且可以被查询,那将是很好的,因为这样很容易。