我正在使用RDFLIB在3个数据集(A,B,C)中使用ntriples构建图形。
目标:图表包含这些数据集之间的链接A-> B,B-> C和C-> A,我想通过确保从A发出的链接返回到检查这些链接的一致性A中的相同条目。
问题:一旦我遍历A-> B中的链接,我想在B-> C中查找相应的条目(可能多于一个),并且对于C-> A,查找相同的条目。 ,有没有办法通过了解主题而不迭代所有条目来查找对象?
答案 0 :(得分:5)
有没有办法通过了解主题而不迭代所有条目来查找对象?
答案是肯定的。您可以使用不同的机制:(a)使用限制进行迭代;或(b)发出SPARQL查询。
(a)约束图并迭代
此解决方案在Graph对象上使用RDFLib triples
函数。见this reference。
#Parse the file
g = rdflib.Graph()
g.parse("yourdata.nquads")
subject = article = rdflib.term.URIRef("http://www.someuri.org/for/your/subject")
# (subject,None,None) represents a constrain to iterate over the graph. By setting
# any of the three elements in the triple you constrain by any combination of subject,
# predicate or object. In this case we only constrain by subject.
for triple in g.triples((subject,None,None)):
print triple
(b)发出SPARQL查询
使用SPARQL standard的更标准的解决方案。
rdflib.plugin.register('sparql', rdflib.query.Processor,
'rdfextras.sparql.processor', 'Processor')
rdflib.plugin.register('sparql', rdflib.query.Result,
'rdfextras.sparql.query', 'SPARQLQueryResult')
#Parse the file
g = rdflib.Graph()
g.parse("yourdata.nquads")
query = """
SELECT ?pred ?obj WHERE {
<http://www.someuri.org/for/your/subject> ?pred ?obj
}
"""
for row in g.query(query):
print "Predicate:%s Object:%s"%(row[0],row[1])