使用rdflib和sparql查询过滤n3 / turtle文件

时间:2012-04-18 15:44:43

标签: python rdf sparql rdflib

我正在尝试使用spdql使用pyrdf过滤一个乌龟文件。但我注意到sparql查询会丢失元素上下文中的信息。我希望然后将查询结果重新打印为乌龟文件,是否可以在不手动扫描元素的所有子字段的情况下执行此操作?我们有关于格式如下的位置的数据:

:pt0001
     vcard:category "Poste e Telegrafi"
    ; vcard:fn "Ufficio Bologna 1"
    ; vcard:extended-address "Via Cairoli 9, Bologna BO, Italy"
    ; vcard:latitude "44.504192"
    ; vcard:longitude "11.338661"
    ; vcard:tel "051 243425"
    ; vcard:fax "051 244459"
    ; cs:opening "Mon, Tue, Wed, Thu, Fri: 0800-1330. Sat: 0800-1230."
    ; cs:closing "01-01, 01-06, P, LA, 04-25, 05-01, 06-02, 08-15, 11-01, 12-08, 12-25, 12-26: .".

例如,我们只想要具有名称(fn)的位置。 感谢您找到的任何提示......

1 个答案:

答案 0 :(得分:4)

要找回所有具有名称的位置,您可以执行以下简单操作:

SELECT DISTINCT ?location
WHERE { 
   ?location vcard:fn [].
}

这将返回标识符(示例中为:pt0001),但当然可以调整查询以返回所有属性值。

编辑我根据您的澄清添加了其他示例,我认为这就是您的目标)

像这样:

SELECT ?location ?prop ?value
WHERE { 
   ?location vcard:fn [];
             ?prop ?value .
} ORDER BY ?location

此查询的结果将是表格结果表:

?location    ?prop           ?value
:pt0001      vcard:category  "Poste e Telegrafi"
:pt0001      vcard:name      "Ufficio Bologna 1"
:pt0001      vcard:tel       "051 243425"
(etc...)   

或者,作为另一种选择,您可以明确制定查询以获取每个位置的特定属性值:

SELECT ?location ?name ?cat ?tel
WHERE { 
   ?location vcard:fn ?name ;
             vcard:category ?cat ;
             vcard:tel ?tel .
} ORDER BY ?location

将返回表格的结果表:

?location ?name               ?cat                ?tel
:pt0001   "Ufficio Bologna 1" "Poste e Telegrafi" "051 243425"

选择。

SPARQL查询的诀窍在于考虑三元组。您的数据包含主题 - 谓词 - 对象三元组,SPARQL查询在这些三元组上形成模式。

进一步说:我看到你正在考虑将查询结果重新打印为turtle。在这种情况下,CONSTRUCT查询可能就是您所追求的。虽然SELECT查询的结果(如上所示)是表结构,但CONSTRUCT查询的结果是RDF三元组的集合:

 CONSTRUCT { ?subject ?predicate ?object }
 WHERE { 
   ?subject ?predicate ?object ;
            vcard:fn [] 
 }