如何使用XQuery将XML文档中的多个节点包装到新节点?

时间:2018-08-30 09:04:51

标签: xml xquery marklogic

我想将多个节点(特定节点)包装到xml文档中的一个新的单个节点中,然后将其插入。

示例XML文档-

<root>
  <value1>somevalue</value1>
  <value2>somevalue</value2>
  <value3>somevalue</value3>
  <value4>somevalue</value4>
  <value5>Australia</value5>
  <value6>India</value6>
  <value7>USA</value7>
  <value8>somevalue</value8>
  <value9>somevalue</value9>
  <value10>somevalue</value10>
</root>

由于我的 value5到value7 是国家/地区的名称,因此我想将它们放在同一父节点上。 输出需要如下所示:

输出-

<root>
  <value1>somevalue</value1>
  <value2>somevalue</value2>
  <value3>somevalue</value3>
  <value4>somevalue</value4>
  <Country>
    <value5>Australia</value5>
    <value6>India</value6>
    <value7>USA</value7>
  </Country>
  <value8>somevalue</value8>
  <value9>somevalue</value9>
  <value10>somevalue</value10>
</root>

类似地,如果我的其他值属于其他某些字段/属性,那么我想在一个新的单个节点中将它们包裹起来。

有什么建议吗?

2 个答案:

答案 0 :(得分:3)

对于相邻元素,您可以使用tumbling window子句https://www.w3.org/TR/xquery-31/#id-tumbling-windows

declare variable $countries as xs:string* := ('Australia', 'India', 'USA');

<root>
{
    for tumbling window $w in root/*
    start $s when true()
    end next $n when ($s = $countries) and not($n = $countries) or (not($s = $countries) and $n = $countries)
    return 
        if ($w[1] = $countries)
        then <Country>
              {$w}
            </Country>
        else $w
}
</root>

https://xqueryfiddle.liberty-development.net/gWcDMeh/2

如果要基于元素名称进行包装,则可以使用window子句

declare variable $countries as xs:QName* := (QName('', 'value5'), QName('', 'value6'), QName('', 'value7'));

<root>
{
    for tumbling window $w in root/*
    start $s when true()
    end next $n 
       when ($s/node-name() = $countries) and not($n/node-name() = $countries)
            or (not($s/node-name() = $countries) and $n/node-name() = $countries)
    return 
        if ($s/node-name() = $countries)
        then <Country>
              {$w}
            </Country>
        else $w
}
</root>

https://xqueryfiddle.liberty-development.net/gWcDMeh/6

我现在也尝试避免使用window子句,而是使用递归函数实现包装:

declare variable $countries as xs:string* := ('Australia', 'India', 'USA');

declare function local:wrap($seq as item()*, $wrapper as element()) as item()*
{
  let $first-item := head($seq)
  return
    if (not($first-item))
    then (if (empty($wrapper/node())) then () else $wrapper)
    else if (not($first-item[. = $countries]))
    then 
      (if (empty($wrapper/node())) then () else $wrapper, 
       $first-item, 
       local:wrap(tail($seq), $wrapper!element {node-name()} {})
      )
    else local:wrap(tail($seq), $wrapper!element {node-name()} { node(), $first-item})
};

<root>
{
    local:wrap(root/*, <countries/>)
}
</root>

似乎在https://xqueryfiddle.liberty-development.net/gWcDMeh/4也能胜任这项工作,我不知道Marklogic是否有意义。如果要基于元素名称而不是值进行换行,则可以使代码适应声明

https://xqueryfiddle.liberty-development.net/gWcDMeh/5
declare variable $countries as xs:QName* := (QName('', 'value5'), QName('', 'value6'), QName('', 'value7'));

然后比较else if (not($first-item/node-name() = $countries))

如果您只需要包装所有value5value6value7元素,那么我认为您可以简单地使用

/root/<root>
{
    let $values := (value5, value6, value7)
    return ( 
        * except $values, 
        if ($values) then <countries>{ $values }</countries> else ()
    )

}
</root>

https://xqueryfiddle.liberty-development.net/gWcDMeh/7

答案 1 :(得分:1)

您可以使用xsl:for-each-group来实现XSLT的目标。

如果要在值不等于“ somevalue”时将它们分组,则可以使用group-adjacent来测试元素值是否等于“ somevalue”,然后包装那些不在<country>元素中。

您可以在MarkLogic的XQuery模块中执行XSLT,如下所示:

xquery version "1.0-ml";
declare variable $doc := document {
<root>
  <value1>somevalue</value1>
  <value2>somevalue</value2>
  <value3>somevalue</value3>
  <value4>somevalue</value4>
  <value5>Australia</value5>
  <value6>India</value6>
  <value7>USA</value7>
  <value8>somevalue</value8>
  <value9>somevalue</value9>
  <value10>somevalue</value10>
</root>
};

declare variable $grouping-xslt :=
  <xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output omit-xml-declaration="yes" indent="yes" />

    <xsl:template match="root">
        <xsl:copy>
            <xsl:for-each-group select="*" group-adjacent=". = 'somevalue'">
                <xsl:choose>
                    <xsl:when test="current-grouping-key()">
                        <xsl:copy-of select="current-group()"/>
                    </xsl:when>
                    <xsl:otherwise>
                        <country>
                            <xsl:copy-of select="current-group()"/>
                        </country>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:for-each-group>        
        </xsl:copy>
    </xsl:template>

</xsl:stylesheet>;

xdmp:xslt-eval($grouping-xslt, $doc)

如果您要分组的国家名称序列已知,则可以使用group-by进行测试,并测试该值是否与任何国家名称匹配:

xquery version "1.0-ml";
declare variable $doc := document {
<root>
  <value1>somevalue</value1>
  <value2>somevalue</value2>
  <value3>somevalue</value3>
  <value4>somevalue</value4>
  <value5>Australia</value5>
  <value6>India</value6>
  <value7>USA</value7>
  <value8>somevalue</value8>
  <value9>somevalue</value9>
  <value10>somevalue</value10>
</root>
};

declare variable $grouping-xslt :=
  <xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output omit-xml-declaration="yes" indent="yes" />
    <xsl:param name="countries" />
    <xsl:template match="root">
        <xsl:copy>
            <xsl:for-each-group select="*" group-by=". = $countries">
                <xsl:choose>
                    <xsl:when test="current-grouping-key()">
                        <country>
                            <xsl:copy-of select="current-group()"/>
                        </country>
                    </xsl:when>
                    <xsl:otherwise>
                         <xsl:copy-of select="current-group()"/>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:for-each-group>        
        </xsl:copy>
    </xsl:template>

</xsl:stylesheet>;

declare variable $params := map:new(map:entry("countries", ("Australia", "India", "USA")));

xdmp:xslt-eval($grouping-xslt, $doc, $params)