XQuery可以支持树结构查询吗?

时间:2012-12-24 01:32:55

标签: tree xquery openehr

我使用sql和基于实体值属性的数据库设计实现了树结构查询机制。 我想在基于XQuery的方法中看到相同功能的性能,假设可以使用XQuery来完成任务。 我的树的简化形式(XLM文档)如下: enter image description here

有不同类型的节点,但我在查询中使用的唯一属性是节点的archetype_node_id属性。我试图编写的测试查询旨在选择具有2个元素节点的Evaluation节点(右侧)。查询实现需要使用所用语言的两个关键功能:支持结构定义的能力(使用布尔运算符),以及为节点属性定义约束的能力(在本例中为xml属性)。

使用XQuery,我有两个问题 1)我似乎无法声明对所有感兴趣的节点的引用,也就是我在图中感兴趣的任何节点 2)我无法弄清楚如何返回匹配,因为此树右侧的匹配将具有一个具有评估的组合,而评估又具有两个元素。

这是我第一次尝试使用FLWR的天真尝试:

    for     $composition in doc("composition-visit.xml")//element()
let    $evaluation := (
                        for $evalsneeded in $composition//element() 
                        let $elementat02 := 
                                            (for $el02 in $evalsneeded//element() 

                                             where $el02/@archetype_node_id = 'at0002'
                                                  and exists($evalsneeded//$el02)
                                             return  $el02
                                            ),
                            $elementat03 := 
                                        (for $el03 in $evalsneeded//element() 

                                         where $el03/@archetype_node_id = 'at0003'
                                                and exists($evalsneeded//$el03)
                                         return  $el03
                                        )
                        where $evalsneeded/@archetype_node_id = 'openEHR-EHR-EVALUATION.goal.v1'
                                 and 
                                    exists ($evalsneeded//$elementat02)
                                     and
                                     exists ($evalsneeded//$elementat03)

                        return $evalsneeded)
where $composition/@archetype_node_id = 'openEHR-EHR-COMPOSITION.encounter.v1'                
        and exists($composition//$evaluation)


return $evaluation/@archetype_node_id/string(.)

我的问题是我最终将评估和元素节点推送到子查询,因为如果我在主FLOWR体中将它们作为全局变量引入,则基于它们的属性值和位置的过滤不起作用。

在返回结果时我更无能为力,但我不想再问一个单独的问题。

理想情况下,当我对具有at0002和at0003代码的元素的Evaluation强制执行A​​ND约束时,我应该得到树的右侧,如果我对相同的元素使用OR约束,我应该得到整棵树。

这可以用XQuery吗?它可以测试我在树中寻找的结构的存在,但我也想访问各个节点。

更新:这是我的第二次尝试。这个实际上打开了我一直试图做的大门,但我不确定这是否是在XQuery中这样做的正确方法。我应该问另一个问题来改进这种方法吗? :

    <result>
{
    for     $composition in doc("composition-visit.xml")//element() 

    where $composition/@archetype_node_id = 'openEHR-EHR-COMPOSITION.encounter.v1'                


    return <composition>
                <name>{$composition/name/value/string(.)}</name>
                <evaluation>{for $eval in $composition//element()
                             let $el1 := (for $el1_in_eval in $eval//element()
                                            where $el1_in_eval/@archetype_node_id = 'at0002'
                                            return $el1_in_eval ),
                                 $el2 := (for $el2_in_eval in $eval//element()
                                            where $el2_in_eval/@archetype_node_id = 'at0003'
                                            return $el2_in_eval )

                                     where $eval/@archetype_node_id = 'openEHR-EHR-EVALUATION.goal.v1'
                                            and
                                            (exists($el1)
                                            and
                                            exists($el2)
                                            )
                                     return <eval>
                                                   <name>{$eval/name/value/string(.)}</name>
                                                   <element1>{for $element1 in $eval//element()
                                                             where $element1/@archetype_node_id = 'at0002'

                                                             return $element1}</element1>
                                                     <element2>{for $element2 in $eval//element()
                                                     where $element2/@archetype_node_id = 'at0003'

                                                     return $element2}</element2>
                                           </eval>
                            }</evaluation>
            </composition>
}
</result>

基本上,我使用let语句强制执行父/子关系,并使用return来获取let的相应匹配值,而let又可以在树下执行相同的匹配。

2 个答案:

答案 0 :(得分:1)

看起来你的用例是查询&#34; archetyped&#34; openEHR数据。

请随意查看使用xQuery的开源https://github.com/LiU-IMT/EEE,以获取与您的用例类似的请求,但数据建模方式略有不同。

用于例如在文章http://www.ep.liu.se/ecp/070/009/ecp1270009.pdf中,您可以在其中找到一个查询示例,该示例返回所有具有组织学检查结果的记录ID,指示2006-01-01和2006-05-01之间的肿瘤病变。

在AQL(原型查询语言)中,它表示为......

SELECT e/ehr_id/value as ehr_id
FROM Ehr e
CONTAINS VERSION v
CONTAINS COMPOSITION c [openEHR-EHR-COMPOSITION.histologic_exam.v1]
CONTAINS OBSERVATION obs [openEHR-EHR-   OBSERVATION.histological_exam_result.v1]
WHERE (EXISTS obs/data[at0001]/events[at0002]/data[at0003]/items[at0085]/items[at0033]/items[at0034] 
OR
EXISTS obs/data[at0001]/events[at0002]/data[at0003]/items[at0085]/items[at0033]/items[at0035])
AND c/context/start_time/value >= '2006-01-01T00:00:00,000+01:00'
AND c/context/start_time/value < '2006-05-01T00:00:00,000+01:00'`

...当自动解析并翻译成如下所示的XQuery时:

declare namespace v1 = "http://schemas.openehr.org/v1";
declare default element namespace "http://schemas.openehr.org/v1";
declare namespace xsi = "http://www.w3.org/2001/XMLSchema-instance";
declare namespace eee = "http://www.imt.liu.se/mi/ehr/2010/EEE-v1.xsd";
declare namespace res = "http://www.imt.liu.se/mi/ehr/2010/xml-result-v1#";
<res:xml-results>
<res:head><res:variable name="ehr_id"/></res:head>
<res:results>
 {let $ehrRoot := //eee:EHR
  for $e in $ehrRoot
  for $v in $e/eee:versioned_objects/eee:versions
  for $c in $v//*[@xsi:type='v1:COMPOSITION' and @archetype_node_id="openEHR-EHR-COMPOSITION.histologic_exam.v1"]
  for $obs in $c//*[@xsi:type='v1:OBSERVATION' and @archetype_node_id= "openEHR-EHR-OBSERVATION.histological_exam_result.v1"]
  where
   (
    exists($obs/data[@archetype_node_id = 'at0001']/events[@archetype_node_id = 'at0002']/data[@archetype_node_id='at0003']/items[@archetype_node_id = 'at0085']/items[@archetype_node_id = 'at0033']/items[@archetype_node_id = 'at0034'])
   or
    exists($obs/data[@archetype_node_id = 'at0001']/events[@archetype_node_ id = 'at0002']/data[@archetype_node_id = 'at0003']/items[@archetype_node_id = 'at0085']/items[@archetype_node_id = 'at0033']/items[@archetype_node_id = 'at0035'])
   )
   and
    $c/context/start_time/value >= '2006-01-01T00:00:00,000+01:00' 
   and 
    $c/context/start_time/value < '2006-05-01T00:00:00,000+01:00'
return
<res:result><res:binding name="ehr_id">{$e/eee:ehr_id/value}</res:binding></res:result>}
</res:results>
</res:xml-results>

这种模式在您的用例中也值得尝试。有关解决方案和上下文的更多详细信息,请参阅论文http://www.biomedcentral.com/1472-6947/13/57

答案 1 :(得分:0)

  

如果树是二叉搜索树,则使用XQuery实现。看这篇文章:

http://dnovatchev.wordpress.com/2012/01/09/the-binary-search-tree-data-structurehaving-fun-with-xpath-3-0/

  

这可能为时已晚,无法使用......但是......看起来你正在用已经根据抽象树定义的混凝土树上实现抽象树。只需直接使用元素树,而不是使用XML元素实现树...