使用XSLT添加属性,然后使用该新属性进行排序

时间:2012-07-15 05:38:49

标签: xslt sorting

我熟悉XSLT的基础知识,但我遇到了一个奇怪的情况,我似乎无法弄清楚。我为此感到抱歉这么久,但我真的很感激你能提供的任何帮助。

我正在使用由我无法控制的软件产品生成的XML转换。该产品导出的数据如下所示:

<header>
   <data>
   </data>
</header>
<transaction>
    <B1_PG1 ts='1139977698718.75'><data></data></B1_PG1>
    <B1_PG2 ts='1139977698718.76'><data></data></B1_PG2>
    <B2_PG1 ts='1139977698718.77'><data></data></B2_PG1>
    <B2_PG2 ts='1139977698718.78'><data></data></B2_PG2>
    <B2_PG1 ts='1139977698718.79'><data></data></B2_PG1>
    <B2_PG2 ts='1139977698718.80'><data></data></B2_PG2>
    <B3_PG1 ts='1139977698718.81'><data></data></B3_PG1>
</transaction>

软件产品按照接收数据的顺序导出数据页面。我需要获取这些页面并按自定义顺序对它们进行排序,以便处理到另一个系统。因此,我创建了一个查找文档,看起来像这样定义我的自定义排序顺序:

(PageSequences.xml)

<pages>
    <page id="B2_PG1" sequence="1000" />
    <page id="B2_PG2" sequence="1010" />
    <page id="B3_PG1" sequence="2000" />
    <page id="B1_PG1" sequence="3000" />
    <page id="B1_PG2" sequence="3010" />
</pages>

然后我根据元素名称查找该序列,将其与时间戳连接,并使用以下XSLT将属性注入元素:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
    <xsl:output omit-xml-declaration="yes" indent="yes"/> 
    <xsl:strip-space elements="*"/> 
    <xsl:variable name='page-seqs' select='document("PageSequences.xml")/pages/page'/>

    <xsl:template match="node()|@*"> 
        <xsl:copy> 
            <xsl:apply-templates select="@*|node()">
            </xsl:apply-templates>
        </xsl:copy> 
    </xsl:template> 

    <xsl:template match="transaction">
        <transaction>

            <xsl:for-each select="child::node()">
                <xsl:variable name='localname' select='local-name()'/>
                <xsl:copy>
                    <xsl:attribute name="sequence">
                        <xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/>
                    </xsl:attribute>
                    <xsl:apply-templates select="@*|node()">
                        <xsl:sort select="@sequence" />
                    </xsl:apply-templates>
                </xsl:copy> 
            </xsl:for-each>
        </transaction>
        </xsl:template> 

</xsl:stylesheet> 

我遇到的问题是标签似乎不起作用。我希望如下:

<transaction>
    <B2_PG1 ts='1139977698718.77' sequence='1000-1139977698718.77'><data></data></B2_PG1>
    <B2_PG1 ts='1139977698718.79' sequence='1000-1139977698718.79'><data></data></B2_PG1>
    <B2_PG2 ts='1139977698718.78' sequence='1010-1139977698718.78'><data></data></B2_PG2>
    <B2_PG2 ts='1139977698718.80' sequence='1010-1139977698718.80'><data></data></B2_PG2>
    <B3_PG1 ts='1139977698718.81' sequence='2000-1139977698718.81'><data></data></B3_PG1>
    <B1_PG1 ts='1139977698718.75' sequence='3000-1139977698718.75'><data></data></B1_PG1>
    <B1_PG2 ts='1139977698718.76' sequence='3010-1139977698718.76'><data></data></B1_PG2>
</transaction>

但我得到了:

<transaction>
    <B1_PG1 ts='1139977698718.75' sequence='3000-1139977698718.75'><data></data></B1_PG1>
    <B1_PG2 ts='1139977698718.76' sequence='3010-1139977698718.76'><data></data></B1_PG2>
    <B2_PG1 ts='1139977698718.77' sequence='1000-1139977698718.77'><data></data></B2_PG1>
    <B2_PG2 ts='1139977698718.78' sequence='1010-1139977698718.78'><data></data></B2_PG2>
    <B2_PG1 ts='1139977698718.79' sequence='1000-1139977698718.79'><data></data></B2_PG1>
    <B2_PG2 ts='1139977698718.80' sequence='1010-1139977698718.80'><data></data></B2_PG2>
    <B3_PG1 ts='1139977698718.81' sequence='2000-1139977698718.81'><data></data></B3_PG1>
</transaction>

另外,如果您认为我以错误的方式接近这个,请告诉我。我试图避免使用java / c#/ perl / etc ...来保持转换尽可能便携。出于性能原因,我还想避免执行两次转换。谢谢!

2 个答案:

答案 0 :(得分:1)

您创建的属性存在于您放置在结果树中的新构造元素上,但它不存在于您要排序的源树中的元素上。

另一个问题是你没有对事务元素的子元素进行排序,而是它的孙子元素。

我怀疑你想要的是这个:

           <xsl:for-each select="child::node()">
              <xsl:sort select="concat($page-seqs[@id=local-name(current())]/@sequence, '-', @ts)"/>
                <xsl:variable name='localname' select='local-name()'/>
                <xsl:copy>
                    <xsl:attribute name="sequence">
                        <xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/>
                    </xsl:attribute>
                    <xsl:apply-templates select="@*|node()"/>
                </xsl:copy> 
            </xsl:for-each>

避免重复计算的唯一方法(一次在xsl:sort中,一次产生输出属性)是两次传递,一次是添加属性,另一次是排序。这样做的方式因XSLT 1.0和2.0而异,您没有说明您使用的是哪种。两次传递方法是非常可行的,但在你的情况下,我怀疑重复计算的单次传递更有效(尽管你必须测量它们才能找到)。

答案 1 :(得分:0)

您遇到的问题是在此代码块中

<xsl:copy> 
   <xsl:attribute name="sequence"> 
      <xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/> 
   </xsl:attribute> 
   <xsl:apply-templates select="@*|node()"> 
      <xsl:sort select="@sequence" /> 
   </xsl:apply-templates> 
</xsl:copy>  

特别是apply-templates。首先,在这个阶段你已经复制并输出了&#34; B-PG&#34; element,以及所有apply-templates正在处理的子节点。其次,排序只适用于输入文档,而不是您添加到输出文档的任何额外属性。

然后,您可以将将事务子节点复制的结果放入变量中,然后使用排序迭代该变量。这将是一个双程转换&#39;在同一个XSLT文档中。但是,在这种情况下,没有必要。您可以简单地匹配所有事务子节点,并在排序

中指定序列号的查找
<xsl:sort select="$page-seqs[@id=local-name(current())]/@sequence" />

这是完整的XSLT

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output omit-xml-declaration="yes" indent="yes"/>
   <xsl:strip-space elements="*"/>

   <xsl:variable name="page-seqs" select="document('C:\lookup.xml')/pages/page"/>

   <xsl:template match="node()|@*">
      <xsl:copy>
         <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
   </xsl:template>

   <xsl:template match="transaction">
      <transaction>
         <xsl:apply-templates select="child::node()">
            <xsl:sort select="$page-seqs[@id=local-name(current())]/@sequence"/>
         </xsl:apply-templates>
      </transaction>
   </xsl:template>
</xsl:stylesheet>

当应用于您的示例文档时(减去标题元素,因为当前XML样本格式不正确),输出以下内容

<transaction>
   <B2_PG1 ts="1139977698718.77">
      <data/>
   </B2_PG1>
   <B2_PG1 ts="1139977698718.79">
      <data/>
   </B2_PG1>
   <B2_PG2 ts="1139977698718.78">
      <data/>
   </B2_PG2>
   <B2_PG2 ts="1139977698718.80">
      <data/>
   </B2_PG2>
   <B3_PG1 ts="1139977698718.81">
      <data/>
   </B3_PG1>
   <B1_PG1 ts="1139977698718.75">
      <data/>
   </B1_PG1>
   <B1_PG2 ts="1139977698718.76">
      <data/>
   </B1_PG2>
</transaction>

请注意,最好使用apply-templates over-each,这就是我在这里所做的。