远程远程端点RDFLib / Redland上的SPARQL查询

时间:2011-05-04 18:17:17

标签: python rdf sparql rdflib redland

我正在尝试查询远程端点并获取owl:sameAs映射,我已经尝试过RDFLib和Redland,但都没有为我工作,可能我没有正确处理命名空间。

这是我在RDFLib中的尝试:

    import rdflib

    rdflib.plugin.register('sparql', rdflib.query.Processor, 'rdfextras.sparql.processor', 'Processor')
    rdflib.plugin.register('sparql', rdflib.query.Result, 'rdfextras.sparql.query', 'SPARQLQueryResult')

    g = rdflib.Graph()

    query = """
        SELECT *
        FROM <http://api.talis.com/stores/bbc-backstage/services/sparql>
        WHERE {
             ?s a http://purl.org/ontology/mo/MusicArtist;
                http://www.w3.org/2002/07/owl#sameAs ?o .
        }Limit 50
    """

    for row in g.query(query):
        print row

这是Redland:

import RDF
model = RDF.Model()

query = """
    SELECT *
    FROM <http://api.talis.com/stores/bbc-backstage/services/sparql>
    WHERE {
         ?s a http://purl.org/ontology/mo/MusicArtist;
            http://www.w3.org/2002/07/owl#sameAs ?o .
    }Limit 50
"""

for statement in RDF.Query(query ,query_language="sparql").execute(model):
    print statement

请你暗示其中任何一个出了什么问题? 我有另一个困难:是否有可能获得对象的数据集名称?例如:如果有:

?s = http://www.bbc.co.uk/music/artists/eb5c8564-927d-414d-b152-c7b48a2c9d8b#artist
predicate = http://www.w3.org/2002/07/owl#sameAs
?0 = http://dbpedia.org/resource/The_Boy_Least_Likely_To

我可以在这个例子中获得“Dbpedia”的名称吗?或者我有同一链接的任何其他数据集? (或者我可能只是在对象字符串中查找感兴趣的数据集名称)非常感谢你提前了

4 个答案:

答案 0 :(得分:12)

各种各样的事情:

您是对的,您需要在< >中附上任何URI。正确的查询是:

SELECT ?s ?o WHERE {
         ?s a <http://purl.org/ontology/mo/MusicArtist>;
            <http://www.w3.org/2002/07/owl#sameAs> ?o .
    } limit 50

...查看结果here

FROM未在您认为的rdflib或redland中实现。它不提取远程SPARQL端点,它在本地存储中提取具有该名称的远程图形或图形。在您的情况下,您想使用SERVICE,请参阅how it works here with Jena。不幸的是,rdflib和redland都没有为SPARQL实现SERVICE子句,但有一些解决方法可以解决这个问题。

一种可能的解决方案是使用SPARQLWrapper for python。这是微不足道的,在这里你有你的代码库:

from SPARQLWrapper import SPARQLWrapper, JSON

sparql = SPARQLWrapper("http://api.talis.com/stores/bbc-backstage/services/sparql")
sparql.setQuery("""
    SELECT ?s ?o
    WHERE {
         ?s a <http://purl.org/ontology/mo/MusicArtist>;
            <http://www.w3.org/2002/07/owl#sameAs> ?o .
    } limit 50
""")
sparql.setReturnFormat(JSON)
results = sparql.query().convert()

for result in results["results"]["bindings"]:
    print result["s"]['value'], result["o"]['value']

如您所见,远程SPARQL端点成为查询之外的参数。

答案 1 :(得分:3)

Redland目前不支持在FROM中使用SPARQL端点。您在这里使用的是加载到RDF数据集中的图形名称。当您使用model.context_add_statement(statement, context)

之类的内容加载三元组(s,p,o)+ c时也称为redland上下文

Rasqal GIT支持解析SERVICE但尚未在查询中执行它。

答案 2 :(得分:1)

您还可以考虑使用Virtuoso with RedLand来实现远程查询执行的SPARQL-FED“服务”参数,如online examples

中所示。

答案 3 :(得分:1)

http://terse-words.blogspot.com/2012/01/get-real-data-from-semantic-web.html的博客条目中还有另一个简单的解决方案,它可以使代码保持相当干净。它也使用SPARQLWrapper。