使用SPARQL为dbpedia实体提取层次结构

时间:2012-06-01 18:21:27

标签: sparql semantic-web dbpedia

我正在尝试使用SPARQL endpoint提取维基百科类别的层次结构或DBpedia资源的Yago分类。例如,我想以实体的层次结构形式找出所有可能的类别和类别,比如http://dbpedia.org/resource/Nokia,比如Thing→Organization→Company→...→Nokia。

1 个答案:

答案 0 :(得分:4)

简单的SPARQL选择可以检索您感兴趣的信息,但不会按层次排列排列。您有兴趣获取资源的所有类型,以及它们之间的rdfs:subClassOf关系。这是Nokia的一个非常简单的查询,可以在DBpedia SPARQL endpoint

上运行
SELECT * WHERE {
  dbpedia:Nokia a ?c1 ; a ?c2 .
  ?c1 rdfs:subClassOf ?c2 .
}

SPARQL results

如果您将该结果集中的每对类视为有向边并执行topological sort,那么您将看到诺基亚资源所属的类的层次结构。实际上,由于将此视为图形可能很方便,因此可以使用SPARQL构造查询以RDF图的形式获取它。

CONSTRUCT WHERE {
  dbpedia:Nokia a ?c1 ; a ?c2 .
  ?c1 rdfs:subClassOf ?c2 .
}

SPARQL results

构造查询生成此图形(采用N3格式):

@prefix rdfs:   <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dbpedia-owl:    <http://dbpedia.org/ontology/> .
@prefix owl:    <http://www.w3.org/2002/07/owl#> .
@prefix yago:   <http://dbpedia.org/class/yago/> .
@prefix rdf:    <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix dbpedia:    <http://dbpedia.org/resource/> .

dbpedia-owl:Agent   rdfs:subClassOf owl:Thing .
dbpedia-owl:Company rdfs:subClassOf dbpedia-owl:Organisation .
dbpedia-owl:Organisation    rdfs:subClassOf dbpedia-owl:Agent .
yago:CompaniesBasedInEspoo  rdfs:subClassOf yago:Company108058098 .
dbpedia:Nokia   rdf:type    yago:CompaniesListedOnTheHelsinkiStockExchange ,
        owl:Thing ,
        yago:CompaniesBasedInEspoo ,
        dbpedia-owl:Agent ,
        yago:DisplayTechnologyCompanies ,
        yago:ElectronicsCompaniesOfFinland ,
        dbpedia-owl:Company ,
        dbpedia-owl:Organisation ,
        yago:Company108058098 ,
        yago:CompaniesEstablishedIn1865 .
yago:CompaniesEstablishedIn1865 rdfs:subClassOf yago:Company108058098 .
yago:CompaniesListedOnTheHelsinkiStockExchange  rdfs:subClassOf yago:Company108058098 .
yago:DisplayTechnologyCompanies rdfs:subClassOf yago:Company108058098 .
yago:ElectronicsCompaniesOfFinland  rdfs:subClassOf yago:Company108058098 .

说明

上述查询会检索诺基亚的rdf:type层次结构。在这个问题中,您还提到了维基百科类别。 DBpedia资源与其对应文章属于dcterms:subject属性的Wikipedia类别相关联。那些维基百科类别然后由skos:broader分层次地构建。虽然这些人确实不是类型。例如,数据包含:

dbpedia:Nokia dcterms:subject category:Finnish_brands
category:Finnish_brands skos:broader category:Brands_by_country

虽然说诺基亚芬兰语品牌可能是有道理的,但说诺基亚 Brand_by_country更没意义。