DBpedia资源名称标准

时间:2013-03-30 00:33:14

标签: dbpedia

DBpedia名称是否有任何标准或惯例?我的意思是,例如,United Kingdom有一个名为United_Kingdom的资源。但是我看到有一个下划线并且每个单词都被大写的事实并不成立。例如,取University_of_Manchester;如果您在“of”中输入大写为“O”的University_Of_Manchester,则无法获得该资源。是否必须在适当的情况下进行过滤以获取资源名称,因为我们可能希望将所有字母设置为小写,在空格中使用下划线并仅进行查询,因为在SPARQL中进行过滤确实需要一些时间。

有什么建议吗?我刚刚开始学习DBpedia,所以我可能会遗漏一些东西。

1 个答案:

答案 0 :(得分:2)

DBpedia对维基百科中可用的信息进行编码,其命名约定基于维基百科文章的名称。 DBpedia维基页面The DBpedia Data Set在第3. Denoting or Naming “Things”节中说:

  

DBpedia数据集中的每个内容都由http://dbpedia.org/resource/Name形式的可引用的基于IRI或URI的引用表示,其中Name是从源Wikipedia文章的URL派生而来的,该文章具有表单http://en.wikipedia.org/wiki/Name。因此,每个DBpedia实体都直接绑定到维基百科文章。每个DBpedia实体名称都解析为面向描述的Web文档(或Web资源)。

     

在DBpedia发布3.6之前,我们只使用了英文维基百科中的文章名称,但自从DBpedia发布3.7版以来,我们还提供了包含http://xx.dbpedia.org/resource/Name等IRI的国际化数据集,其中xx是维基百科语言代码,名称取自来自源网址http://xx.wikipedia.org/wiki/Name

因此,由于维基百科文章为University of Manchester,而非University Of Manchester,因此DBpedia资源为http://dbpedia.org/page/University_of_Manchester,而非http://dbpedia.org/page/University_Of_Manchester