我熟悉XSLT的基础知识,但我遇到了一个奇怪的情况,我似乎无法弄清楚。我为此感到抱歉这么久,但我真的很感激你能提供的任何帮助。
我正在使用由我无法控制的软件产品生成的XML转换。该产品导出的数据如下所示:
<header>
<data>
</data>
</header>
<transaction>
<B1_PG1 ts='1139977698718.75'><data></data></B1_PG1>
<B1_PG2 ts='1139977698718.76'><data></data></B1_PG2>
<B2_PG1 ts='1139977698718.77'><data></data></B2_PG1>
<B2_PG2 ts='1139977698718.78'><data></data></B2_PG2>
<B2_PG1 ts='1139977698718.79'><data></data></B2_PG1>
<B2_PG2 ts='1139977698718.80'><data></data></B2_PG2>
<B3_PG1 ts='1139977698718.81'><data></data></B3_PG1>
</transaction>
软件产品按照接收数据的顺序导出数据页面。我需要获取这些页面并按自定义顺序对它们进行排序,以便处理到另一个系统。因此,我创建了一个查找文档,看起来像这样定义我的自定义排序顺序:
(PageSequences.xml)
<pages>
<page id="B2_PG1" sequence="1000" />
<page id="B2_PG2" sequence="1010" />
<page id="B3_PG1" sequence="2000" />
<page id="B1_PG1" sequence="3000" />
<page id="B1_PG2" sequence="3010" />
</pages>
然后我根据元素名称查找该序列,将其与时间戳连接,并使用以下XSLT将属性注入元素:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:variable name='page-seqs' select='document("PageSequences.xml")/pages/page'/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="@*|node()">
</xsl:apply-templates>
</xsl:copy>
</xsl:template>
<xsl:template match="transaction">
<transaction>
<xsl:for-each select="child::node()">
<xsl:variable name='localname' select='local-name()'/>
<xsl:copy>
<xsl:attribute name="sequence">
<xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/>
</xsl:attribute>
<xsl:apply-templates select="@*|node()">
<xsl:sort select="@sequence" />
</xsl:apply-templates>
</xsl:copy>
</xsl:for-each>
</transaction>
</xsl:template>
</xsl:stylesheet>
我遇到的问题是标签似乎不起作用。我希望如下:
<transaction>
<B2_PG1 ts='1139977698718.77' sequence='1000-1139977698718.77'><data></data></B2_PG1>
<B2_PG1 ts='1139977698718.79' sequence='1000-1139977698718.79'><data></data></B2_PG1>
<B2_PG2 ts='1139977698718.78' sequence='1010-1139977698718.78'><data></data></B2_PG2>
<B2_PG2 ts='1139977698718.80' sequence='1010-1139977698718.80'><data></data></B2_PG2>
<B3_PG1 ts='1139977698718.81' sequence='2000-1139977698718.81'><data></data></B3_PG1>
<B1_PG1 ts='1139977698718.75' sequence='3000-1139977698718.75'><data></data></B1_PG1>
<B1_PG2 ts='1139977698718.76' sequence='3010-1139977698718.76'><data></data></B1_PG2>
</transaction>
但我得到了:
<transaction>
<B1_PG1 ts='1139977698718.75' sequence='3000-1139977698718.75'><data></data></B1_PG1>
<B1_PG2 ts='1139977698718.76' sequence='3010-1139977698718.76'><data></data></B1_PG2>
<B2_PG1 ts='1139977698718.77' sequence='1000-1139977698718.77'><data></data></B2_PG1>
<B2_PG2 ts='1139977698718.78' sequence='1010-1139977698718.78'><data></data></B2_PG2>
<B2_PG1 ts='1139977698718.79' sequence='1000-1139977698718.79'><data></data></B2_PG1>
<B2_PG2 ts='1139977698718.80' sequence='1010-1139977698718.80'><data></data></B2_PG2>
<B3_PG1 ts='1139977698718.81' sequence='2000-1139977698718.81'><data></data></B3_PG1>
</transaction>
另外,如果您认为我以错误的方式接近这个,请告诉我。我试图避免使用java / c#/ perl / etc ...来保持转换尽可能便携。出于性能原因,我还想避免执行两次转换。谢谢!
答案 0 :(得分:1)
您创建的属性存在于您放置在结果树中的新构造元素上,但它不存在于您要排序的源树中的元素上。
另一个问题是你没有对事务元素的子元素进行排序,而是它的孙子元素。
我怀疑你想要的是这个:
<xsl:for-each select="child::node()">
<xsl:sort select="concat($page-seqs[@id=local-name(current())]/@sequence, '-', @ts)"/>
<xsl:variable name='localname' select='local-name()'/>
<xsl:copy>
<xsl:attribute name="sequence">
<xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/>
</xsl:attribute>
<xsl:apply-templates select="@*|node()"/>
</xsl:copy>
</xsl:for-each>
避免重复计算的唯一方法(一次在xsl:sort中,一次产生输出属性)是两次传递,一次是添加属性,另一次是排序。这样做的方式因XSLT 1.0和2.0而异,您没有说明您使用的是哪种。两次传递方法是非常可行的,但在你的情况下,我怀疑重复计算的单次传递更有效(尽管你必须测量它们才能找到)。
答案 1 :(得分:0)
您遇到的问题是在此代码块中
<xsl:copy>
<xsl:attribute name="sequence">
<xsl:value-of select='$page-seqs[@id=$localname]/@sequence'/>-<xsl:value-of select='@ts'/>
</xsl:attribute>
<xsl:apply-templates select="@*|node()">
<xsl:sort select="@sequence" />
</xsl:apply-templates>
</xsl:copy>
特别是apply-templates。首先,在这个阶段你已经复制并输出了&#34; B-PG&#34; element,以及所有apply-templates正在处理的子节点。其次,排序只适用于输入文档,而不是您添加到输出文档的任何额外属性。
然后,您可以将将事务子节点复制的结果放入变量中,然后使用排序迭代该变量。这将是一个双程转换&#39;在同一个XSLT文档中。但是,在这种情况下,没有必要。您可以简单地匹配所有事务子节点,并在排序
中指定序列号的查找<xsl:sort select="$page-seqs[@id=local-name(current())]/@sequence" />
这是完整的XSLT
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:variable name="page-seqs" select="document('C:\lookup.xml')/pages/page"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="@*|node()"/>
</xsl:copy>
</xsl:template>
<xsl:template match="transaction">
<transaction>
<xsl:apply-templates select="child::node()">
<xsl:sort select="$page-seqs[@id=local-name(current())]/@sequence"/>
</xsl:apply-templates>
</transaction>
</xsl:template>
</xsl:stylesheet>
当应用于您的示例文档时(减去标题元素,因为当前XML样本格式不正确),输出以下内容
<transaction>
<B2_PG1 ts="1139977698718.77">
<data/>
</B2_PG1>
<B2_PG1 ts="1139977698718.79">
<data/>
</B2_PG1>
<B2_PG2 ts="1139977698718.78">
<data/>
</B2_PG2>
<B2_PG2 ts="1139977698718.80">
<data/>
</B2_PG2>
<B3_PG1 ts="1139977698718.81">
<data/>
</B3_PG1>
<B1_PG1 ts="1139977698718.75">
<data/>
</B1_PG1>
<B1_PG2 ts="1139977698718.76">
<data/>
</B1_PG2>
</transaction>
请注意,最好使用apply-templates over-each,这就是我在这里所做的。