XML,XSLT按标题将相同元素分组并带有子节点

时间:2018-08-07 11:00:11

标签: xml xslt wkhtmltopdf

我正在尝试从wkhtmltopdf的XML大纲输出中构建附录/索引页面。

是否有一种方法可以遍历元素并将其按特定的属性值分组,而无需使用key()函数或XSLT 2.0 for-each-group?这是由于wkhtmltopdf中使用的XSL处理器中的某些限制。

我正在考虑使用前一个兄弟姐妹来检查标题是否仍然相同。

<xsl:for-each select="//o:item">
   <xsl:sort select="@title"></xsl:sort>
   <xsl:variable name="key" select="@title" />
   <xsl:if test="not(preceding-sibling::o:item[@title=$key])">
       <xsl:value-of select="$key"></xsl:value-of>
       <xsl:for-each select="current()/o:item">
         <xsl:element name="{@title}" />
       </xsl:for-each>
    </xsl:if> 
</xsl:for-each>

我对XSLT还是很陌生,因此非常感谢您的帮助。

这是wkhtmltopdf的大纲xml:

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="toc.xsl"?>
<outline xmlns="http://wkhtmltopdf.org/outline">
    <item title="PDF" page="0" link="__WKANCHOR_0" backLink="__WKANCHOR_1">
        <item title="Type1" page="1" link="__WKANCHOR_2" backLink="__WKANCHOR_3">
            <item title="SubType1" page="1" link="__WKANCHOR_4" backLink="__WKANCHOR_5">
                <item title="Collection1" page="1" link="__WKANCHOR_6" backLink="__WKANCHOR_7">
                    <item title="Item1" page="1" link="__WKANCHOR_8" backLink="__WKANCHOR_9"/>
                </item>
                <item title="Collection2" page="1" link="__WKANCHOR_a" backLink="__WKANCHOR_b">
                    <item title="Item2" page="1" link="__WKANCHOR_c" backLink="__WKANCHOR_d"/>
                    <item title="Item3" page="2" link="__WKANCHOR_e" backLink="__WKANCHOR_f"/>
                </item>
            </item>
            <item title="SubType2" page="3" link="__WKANCHOR_g" backLink="__WKANCHOR_h">
                <item title="Collection1" page="3" link="__WKANCHOR_i" backLink="__WKANCHOR_j">
                    <item title="Item4" page="3" link="__WKANCHOR_k" backLink="__WKANCHOR_l"/>
                </item>
            </item>
        </item>
        <item title="Type2" page="4" link="__WKANCHOR_m" backLink="__WKANCHOR_n">
            <item title="SubType1" page="4" link="__WKANCHOR_o" backLink="__WKANCHOR_p">
                <item title="Collection1" page="5" link="__WKANCHOR_u" backLink="__WKANCHOR_v">
                    <item title="Item5" page="4" link="__WKANCHOR_q" backLink="__WKANCHOR_r"/>
                </item>
            </item>
            <item title="SubType3" page="5" link="__WKANCHOR_s" backLink="__WKANCHOR_t">
                <item title="Collection3" page="5" link="__WKANCHOR_u" backLink="__WKANCHOR_v">
                    <item title="Item6" page="5" link="__WKANCHOR_w" backLink="__WKANCHOR_x"/>
                    <item title="Item7" page="5" link="__WKANCHOR_y" backLink="__WKANCHOR_z"/>
                    <item title="Item8" page="5" link="__WKANCHOR_10" backLink="__WKANCHOR_11"/>
                </item>
            </item>
        </item>
    </item>
</outline>

预期输出为(将所有不同的第4个子项归为一组):

<Collection1>
    <Item1></Item1>
    <Item4></Item4>
    <Item5></Item5>
</Collection1>
<Collection2>
    <Item2></Item2>
    <Item3></Item3>
</Collection2>
<Collection3>
    <Item6></Item6>
    <Item7></Item7>
    <Item8></Item8>
</Collection3>

1 个答案:

答案 0 :(得分:2)

您可以在<xsl:for-each-group>上使用group-by@title[contains(., 'Collection')]来准备组,然后在current-group()上循环以获取元素。

请尝试以下 XSLT 2.0 解决方案

<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:o="http://wkhtmltopdf.org/outline">
    <xsl:output method="xml" indent="yes" />
    <xsl:strip-space elements="*" />

    <xsl:template match="/">
        <xsl:for-each-group select="//o:item" group-by="@title[contains(., 'Collection')]">
            <xsl:element name="{current-grouping-key()}">
                <xsl:for-each select="current-group()/o:item">
                    <xsl:element name="{@title}" />
                </xsl:for-each>
            </xsl:element>
        </xsl:for-each-group>
    </xsl:template>
</xsl:stylesheet>

如果正在使用 XSLT 1.0 ,则必须定义<xsl:key>,然后循环应在分组元素上运行。下面是XSLT 1.0解决方案。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:o="http://wkhtmltopdf.org/outline">
    <xsl:output method="xml" />
    <xsl:strip-space elements="*" />

    <xsl:key name="kTitle" match="//o:item" use="@title[contains(.,'Collection')]" />

    <xsl:template match="/">
        <xsl:for-each select="//o:item[generate-id() = generate-id(key('kTitle', @title[contains(.,'Collection')])[1])]">
            <xsl:element name="{@title}">
                <xsl:for-each select="key('kTitle', @title[contains(.,'Collection')])/o:item">
                    <xsl:element name="{@title}" />
                </xsl:for-each>
            </xsl:element>
        </xsl:for-each>
    </xsl:template>
</xsl:stylesheet>

输出

<Collection1>
   <Item1/>
   <Item4/>
   <Item5/>
</Collection1>
<Collection2>
   <Item2/>
   <Item3/>
</Collection2>
<Collection3>
   <Item6/>
   <Item7/>
   <Item8/>
</Collection3>