DBpedia似乎充满了错误

时间:2015-10-09 22:54:30

标签: sparql dbpedia opendata

我只是掌握了链接数据,当然还有DBpedia,希望它对我的工作有所帮助。

我只是想编写一些SPARQL查询来熟悉数据和技术,但我对结果感到震惊,并且想知道我是否在这里没有获得核心概念。例如,如果我希望DBpedia给我一个所有国家的列表,我会天真地想象,每个国家都是"类型" dbo:country以及如果"类型为" dbo:country,然后肯定会有一个国家。

所以,我想回归所有国家的天真的SPARQL查询只是

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?concept
WHERE {?concept a dbo:Country}

现在,这个查询返回了很多我期望的东西。现有国家,前国家,属于其他国家的国家,当然还有芬兰国家板球队。

等等,什么?!?!?!

为什么这个查询会回归芬兰国家板球队?当然,那不能是国家类型的实体,可以吗?让我来......

http://dbpedia.org/page/Finland_national_cricket_team

喔。 可以

我的理解是这是DBpedia的错误是否正确?是否所有链接数据都受到异常值的污染?我的意思是,在我的问题回归中有更奇怪的事情,比如英国的篮球队,印第安纳民主党,美国驻巴基斯坦大使等等。这种污染是给定的还是我在这里错过了一个观点?

1 个答案:

答案 0 :(得分:2)

  

我的理解是这是DBpedia的错误是否正确?

是的,我相信。如果你仔细观察,你会注意到芬兰国家板球队是dbo:country dbr:Jonathan_October。我不太明白为什么会这样,但我认为这是问题的根源。

  

所有链接数据是否都受到异常值的污染?

我不这么认为,它总是取决于数据的来源。但是,如果它类似于从维基百科自动提取的数据,那么总会有问题(尽管大多数情况下希望不是这种规模)。