从SPARQL查询返回嵌套数据结构

时间:2017-06-19 04:53:54

标签: sparql

如果我有这种结构的图表:

@prefix  :       <http://example/> .
@prefix  rdf:    <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix  foaf:   <http://xmlns.com/foaf/0.1/> .

:alice rdf:type        foaf:Person .
:alice foaf:givenName  "Alice" .
:alice foaf:familyName "Liddell" .

:bob   rdf:type        foaf:Person .
:bob   foaf:givenName  "Bob" .
:bob   foaf:familyName "Doe" .

:choi  rdf:type        foaf:Person .
:choi  foaf:givenName  "Hwa" .
:choi  foaf:familyName "Choi" .

:alice :knows          :bob, :choi .

如何以某种结构化格式获取Alice知道的人的姓名?理想的格式是:

[
  {
    "given": "Alice",
    "family": "Liddell",
    "knows": [
      { "given": "Bob", "family": "Doe" },
      { "given": "Hwa", "family": "Choi" }
    ]
  }
]

如果我只想要一个属性的数组,我可以做类似的事情:

SELECT ?name, (group_concat(distinct ?name;separator="|||") as ?friend_names)
WHERE {
  ?person foaf:givenName ?name,
  ?person :knows ?friend .
  ?friend foaf:givenName ?friend_name
}
GROUP BY ?name

然后,假设|||没有出现在任何名称中,请解压缩结果。

有没有办法让上面的响应结构具有多个属性(例如givenfamily),理想情况下没有硬编码的分隔符技巧?

3 个答案:

答案 0 :(得分:5)

您可以使用JSON-LD Framing进行CONSTRUCT查询。

示例查询(在DBpedia endpoint上)

CONSTRUCT
{
  ?person  rdf:type       foaf:Person ;
           dbo:birthName  ?name1s ;
           dbo:birthDate  ?date1s ;
           dbo:spouse     ?spouse .
  ?spouse  rdf:type       foaf:Person ; 
           dbo:birthName  ?name2s ;
           dbo:birthDate  ?date2s .
}
WHERE
{
  ?person  dbo:birthName  ?name1 ;
           dbo:birthDate  ?date1 ;
           dbo:spouse     ?spouse .
  ?spouse  dbo:birthName  ?name2 ;
           dbo:birthDate  ?date2 .
  BIND (str(?name1) AS ?name1s)
  BIND (str(?date1) AS ?date1s)
  BIND (str(?name2) AS ?name2s)
  BIND (str(?date2) AS ?date2s)
  VALUES (?person) { ( dbr:Brad_Pitt ) }
}

输出(在JSON-LD format上下文中)

{ "@context": {
    "spouse": { "@id": "http://dbpedia.org/ontology/spouse"},
    "birthDate": { "@id": "http://dbpedia.org/ontology/birthDate" },
    "birthName": { "@id": "http://dbpedia.org/ontology/birthName" } },
  "@graph": [
    { "@id": "http://dbpedia.org/resource/Angelina_Jolie",
      "birthName": "Angelina Jolie Voight",
      "birthDate": "1975-06-04" },
    { "@id": "http://dbpedia.org/resource/Brad_Pitt",
      "@type": "http://xmlns.com/foaf/0.1/Person",
      "birthName": "William Bradley Pitt",
      "spouse": [ "http://dbpedia.org/resource/Angelina_Jolie",
                  "http://dbpedia.org/resource/Jennifer_Aniston" ],
      "birthDate": "1963-12-18" },
    { "@id": "http://dbpedia.org/resource/Jennifer_Aniston",
      "birthName": "Jennifer Joanna Aniston",
      "birthDate": "1969-02-11" }
] }

JSON-LD框架(非常简单)

{
  "@context": {"dbo": "http://dbpedia.org/ontology/",
               "dbr": "http://dbpedia.org/resource/",
               "foaf": "http://xmlns.com/foaf/0.1/"},
  "dbo:spouse": {
   }
}

框架JSON-LD playground

{
  "@context": {
    "dbo": "http://dbpedia.org/ontology/",
    "dbr": "http://dbpedia.org/resource/",
    "foaf": "http://xmlns.com/foaf/0.1/"
  },
  "@graph": [
    {
      "@id": "dbr:Brad_Pitt",
      "@type": "foaf:Person",
      "dbo:birthDate": "1963-12-18",
      "dbo:birthName": "William Bradley Pitt",
      "dbo:spouse": [
        {
          "@id": "dbr:Angelina_Jolie",
          "@type": "foaf:Person",
          "dbo:birthDate": "1975-06-04",
          "dbo:birthName": "Angelina Jolie Voight"
        },
        {
          "@id": "dbr:Jennifer_Aniston",
          "@type": "foaf:Person",
          "dbo:birthDate": "1969-02-11",
          "dbo:birthName": "Jennifer Joanna Aniston"
        }
      ]
    }
  ]
}

一些讨论

JSON-LD Framing是一个非官方但实现良好的规范,描述了将RDF图序列化为特定JSON-LD文档布局的确定性布局。

显然,使用blank nodes property lists,可以实现与您想要的输出结构相似的东西:

Brad_Pitt
        dbo:birthName   "William Bradley Pitt" ;
        dbo:birthDate   "1963-12-18" .
        dbo:spouse  [   dbo:birthName   "Angelina Jolie Voight" ;
                        dbo:birthDate   "1975-06-04" ] ,
                    [   dbo:birthName   "Jennifer Joanna Aniston" ;
                        dbo:birthDate   "1969-02-11" ] .

然而,这是Turtle,而不是JSON,并且没有人能够保证这些空白节点属性列表将用于序列化。

答案 1 :(得分:2)

您将查询结果本身(实际上是一个抽象表结构)与写入结果的语法(在您的情况下,是一个自定义的嵌套JSON结构)混淆在一起。

在这种情况下,不要尝试使用群组连接做一些技巧。只需执行此查询:

SELECT ?given ?family ?friend_given ?friend_family
WHERE {
  ?person foaf:givenName ?given ;
          foaf:familyName ?family .
  ?person :knows ?friend .
  ?friend foaf:givenName ?friend_given ;
          foaf:familyName ?friend_family .
}
GROUP BY ?family ?given

结果如下:

given  family  friend_given friend_family
-------------------------------------------- 
Alice  Lidell  Bob          Doe
Alice  Lidell  Hwa          Choi

然后让自定义流式结果编写器将结果写入您需要的嵌套语法格式。鉴于查询按名称分组,作者可以安全地假设具有相同给定和姓氏的后续行属于&#34;。

或者,使用CONSTRUCT查询而不是SELECT,并对检索到的RDF图进行后处理(准确表示您之后的树结构)。

答案 2 :(得分:0)

两个答案都没有提到笛卡尔爆炸的危险。如果您具有根人员的多值字段,则将这些字段乘以多个相关人员,从而创建不必要的行。 构造可能会使那些多余的行折叠起来,但是仍然:担心不应放在首位。因此,请使用联合而不是直线模式。