我使用sql和基于实体值属性的数据库设计实现了树结构查询机制。 我想在基于XQuery的方法中看到相同功能的性能,假设可以使用XQuery来完成任务。 我的树的简化形式(XLM文档)如下:
有不同类型的节点,但我在查询中使用的唯一属性是节点的archetype_node_id属性。我试图编写的测试查询旨在选择具有2个元素节点的Evaluation节点(右侧)。查询实现需要使用所用语言的两个关键功能:支持结构定义的能力(使用布尔运算符),以及为节点属性定义约束的能力(在本例中为xml属性)。
使用XQuery,我有两个问题 1)我似乎无法声明对所有感兴趣的节点的引用,也就是我在图中感兴趣的任何节点 2)我无法弄清楚如何返回匹配,因为此树右侧的匹配将具有一个具有评估的组合,而评估又具有两个元素。
这是我第一次尝试使用FLWR的天真尝试:
for $composition in doc("composition-visit.xml")//element()
let $evaluation := (
for $evalsneeded in $composition//element()
let $elementat02 :=
(for $el02 in $evalsneeded//element()
where $el02/@archetype_node_id = 'at0002'
and exists($evalsneeded//$el02)
return $el02
),
$elementat03 :=
(for $el03 in $evalsneeded//element()
where $el03/@archetype_node_id = 'at0003'
and exists($evalsneeded//$el03)
return $el03
)
where $evalsneeded/@archetype_node_id = 'openEHR-EHR-EVALUATION.goal.v1'
and
exists ($evalsneeded//$elementat02)
and
exists ($evalsneeded//$elementat03)
return $evalsneeded)
where $composition/@archetype_node_id = 'openEHR-EHR-COMPOSITION.encounter.v1'
and exists($composition//$evaluation)
return $evaluation/@archetype_node_id/string(.)
我的问题是我最终将评估和元素节点推送到子查询,因为如果我在主FLOWR体中将它们作为全局变量引入,则基于它们的属性值和位置的过滤不起作用。
在返回结果时我更无能为力,但我不想再问一个单独的问题。
理想情况下,当我对具有at0002和at0003代码的元素的Evaluation强制执行AND约束时,我应该得到树的右侧,如果我对相同的元素使用OR约束,我应该得到整棵树。
这可以用XQuery吗?它可以测试我在树中寻找的结构的存在,但我也想访问各个节点。
更新:这是我的第二次尝试。这个实际上打开了我一直试图做的大门,但我不确定这是否是在XQuery中这样做的正确方法。我应该问另一个问题来改进这种方法吗? :
<result>
{
for $composition in doc("composition-visit.xml")//element()
where $composition/@archetype_node_id = 'openEHR-EHR-COMPOSITION.encounter.v1'
return <composition>
<name>{$composition/name/value/string(.)}</name>
<evaluation>{for $eval in $composition//element()
let $el1 := (for $el1_in_eval in $eval//element()
where $el1_in_eval/@archetype_node_id = 'at0002'
return $el1_in_eval ),
$el2 := (for $el2_in_eval in $eval//element()
where $el2_in_eval/@archetype_node_id = 'at0003'
return $el2_in_eval )
where $eval/@archetype_node_id = 'openEHR-EHR-EVALUATION.goal.v1'
and
(exists($el1)
and
exists($el2)
)
return <eval>
<name>{$eval/name/value/string(.)}</name>
<element1>{for $element1 in $eval//element()
where $element1/@archetype_node_id = 'at0002'
return $element1}</element1>
<element2>{for $element2 in $eval//element()
where $element2/@archetype_node_id = 'at0003'
return $element2}</element2>
</eval>
}</evaluation>
</composition>
}
</result>
基本上,我使用let语句强制执行父/子关系,并使用return来获取let的相应匹配值,而let又可以在树下执行相同的匹配。
答案 0 :(得分:1)
看起来你的用例是查询&#34; archetyped&#34; openEHR数据。
请随意查看使用xQuery的开源https://github.com/LiU-IMT/EEE,以获取与您的用例类似的请求,但数据建模方式略有不同。
用于例如在文章http://www.ep.liu.se/ecp/070/009/ecp1270009.pdf中,您可以在其中找到一个查询示例,该示例返回所有具有组织学检查结果的记录ID,指示2006-01-01和2006-05-01之间的肿瘤病变。
在AQL(原型查询语言)中,它表示为......
SELECT e/ehr_id/value as ehr_id
FROM Ehr e
CONTAINS VERSION v
CONTAINS COMPOSITION c [openEHR-EHR-COMPOSITION.histologic_exam.v1]
CONTAINS OBSERVATION obs [openEHR-EHR- OBSERVATION.histological_exam_result.v1]
WHERE (EXISTS obs/data[at0001]/events[at0002]/data[at0003]/items[at0085]/items[at0033]/items[at0034]
OR
EXISTS obs/data[at0001]/events[at0002]/data[at0003]/items[at0085]/items[at0033]/items[at0035])
AND c/context/start_time/value >= '2006-01-01T00:00:00,000+01:00'
AND c/context/start_time/value < '2006-05-01T00:00:00,000+01:00'`
...当自动解析并翻译成如下所示的XQuery时:
declare namespace v1 = "http://schemas.openehr.org/v1";
declare default element namespace "http://schemas.openehr.org/v1";
declare namespace xsi = "http://www.w3.org/2001/XMLSchema-instance";
declare namespace eee = "http://www.imt.liu.se/mi/ehr/2010/EEE-v1.xsd";
declare namespace res = "http://www.imt.liu.se/mi/ehr/2010/xml-result-v1#";
<res:xml-results>
<res:head><res:variable name="ehr_id"/></res:head>
<res:results>
{let $ehrRoot := //eee:EHR
for $e in $ehrRoot
for $v in $e/eee:versioned_objects/eee:versions
for $c in $v//*[@xsi:type='v1:COMPOSITION' and @archetype_node_id="openEHR-EHR-COMPOSITION.histologic_exam.v1"]
for $obs in $c//*[@xsi:type='v1:OBSERVATION' and @archetype_node_id= "openEHR-EHR-OBSERVATION.histological_exam_result.v1"]
where
(
exists($obs/data[@archetype_node_id = 'at0001']/events[@archetype_node_id = 'at0002']/data[@archetype_node_id='at0003']/items[@archetype_node_id = 'at0085']/items[@archetype_node_id = 'at0033']/items[@archetype_node_id = 'at0034'])
or
exists($obs/data[@archetype_node_id = 'at0001']/events[@archetype_node_ id = 'at0002']/data[@archetype_node_id = 'at0003']/items[@archetype_node_id = 'at0085']/items[@archetype_node_id = 'at0033']/items[@archetype_node_id = 'at0035'])
)
and
$c/context/start_time/value >= '2006-01-01T00:00:00,000+01:00'
and
$c/context/start_time/value < '2006-05-01T00:00:00,000+01:00'
return
<res:result><res:binding name="ehr_id">{$e/eee:ehr_id/value}</res:binding></res:result>}
</res:results>
</res:xml-results>
这种模式在您的用例中也值得尝试。有关解决方案和上下文的更多详细信息,请参阅论文http://www.biomedcentral.com/1472-6947/13/57
答案 1 :(得分:0)
如果树是二叉搜索树,则使用XQuery实现。看这篇文章:
这可能为时已晚,无法使用......但是......看起来你正在用已经根据抽象树定义的混凝土树上实现抽象树。只需直接使用元素树,而不是使用XML元素实现树...