XSLT 1.0:重命名具有相同内容的元素

时间:2013-02-14 12:49:04

标签: xslt key renaming muenchian-grouping

这似乎是一件容易的事,但我现在完全被困住了。我有以下XML:

<?xml version="1.0" encoding="UTF-8"?>
<Items>
<Item>
    <ITEM_CODE>ITEM_CODE</ITEM_CODE>
    <ITEM_NAME>ITEM_NAME</ITEM_NAME>
    <ITEM_ALTERNATE_NAME>ITEM_ALTERNATE_NAME</ITEM_ALTERNATE_NAME>
    <ITEM_CATEGORY_CODE>ITEM_CATEGORY_CODE</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>15031</ITEM_CODE>
    <ITEM_NAME>Outer Carton</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150529</ITEM_CODE>
    <ITEM_NAME>Outer Carton</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150999</ITEM_CODE>
    <ITEM_NAME>Outer Carton</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150988</ITEM_CODE>
    <ITEM_NAME>test</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
</Items>

如果<ITEM_NAME>元素具有重复内容,则应使用后缀重命名,例如计数器值。我想出了这个XSLT:

<?xml version="1.0" encoding="UTF-8"?>

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">

<xsl:output encoding="UTF-8" method="xml" indent="yes"/>

<xsl:key name="keyItemName" match="Item" use="concat(ITEM_CODE , '|', ITEM_NAME)"/>

<xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
</xsl:template>

<xsl:template match="Items">
    <Items>
        <xsl:apply-templates select="@*|node()"/>
    </Items>    
</xsl:template>

<xsl:template match="ITEM_NAME">

    <xsl:for-each select="parent::Item[generate-id()=generate-id(key('keyItemName',concat(ITEM_CODE , '|', ITEM_NAME))[1])]">
        <xsl:variable name="number">
            <xsl:number/>
        </xsl:variable>
        <ITEM_NAME>
            <xsl:value-of select="concat(ITEM_NAME,'-',$number)"/>
        </ITEM_NAME>
    </xsl:for-each>
</xsl:template>

</xsl:stylesheet>

它给了我这个输出:

<?xml version="1.0" encoding="UTF-8"?>
<Items>
<Item>
    <ITEM_CODE>ITEM_CODE</ITEM_CODE>
    <ITEM_NAME>ITEM_NAME-1</ITEM_NAME>
    <ITEM_ALTERNATE_NAME>ITEM_ALTERNATE_NAME</ITEM_ALTERNATE_NAME>
    <ITEM_CATEGORY_CODE>ITEM_CATEGORY_CODE</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>15031</ITEM_CODE>
    <ITEM_NAME>Outer Carton-2</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150529</ITEM_CODE>
    <ITEM_NAME>Outer Carton-3</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150999</ITEM_CODE>
    <ITEM_NAME>Outer Carton-4</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150988</ITEM_CODE>
    <ITEM_NAME>test-5</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
</Items>

但我希望这个输出:

<?xml version="1.0" encoding="UTF-8"?>
<Items>
<Item>
    <ITEM_CODE>ITEM_CODE</ITEM_CODE>
    <ITEM_NAME>ITEM_NAME</ITEM_NAME>
    <ITEM_ALTERNATE_NAME>ITEM_ALTERNATE_NAME</ITEM_ALTERNATE_NAME>
    <ITEM_CATEGORY_CODE>ITEM_CATEGORY_CODE</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>15031</ITEM_CODE>
    <ITEM_NAME>Outer Carton-2</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150529</ITEM_CODE>
    <ITEM_NAME>Outer Carton-3</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150999</ITEM_CODE>
    <ITEM_NAME>Outer Carton-4</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
<Item>
    <ITEM_CODE>150988</ITEM_CODE>
    <ITEM_NAME>test</ITEM_NAME>
    <ITEM_ALTERNATE_NAME/>
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
</Item>
</Items>

在上一个<Item>中,ITEM_NAME不应重命名,因为它不称为“外部纸箱”。同样在第一个<Item>元素中,不应该重命名。

我接近解决方案,但我无法解决这个问题。有人可以帮忙 - 非常感谢!

祝你好运, 彼得

2 个答案:

答案 0 :(得分:1)

使用preceding::preceding-sibling::来计算先前的实例在计算上并不是非常有效,但我在这里看不到解决方法。下面的方法确实有这样的好处:只有在检查后(使用一个非常快的键)还有其他具有相同名称的项目时,它才计算前面的实例:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
  <xsl:output encoding="UTF-8" method="xml" indent="yes"/>

  <xsl:key name="keyItemName" match="ITEM_NAME" use="."/>

  <xsl:template match="@*|node()">
    <xsl:copy>
      <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
  </xsl:template>

  <xsl:template match="Items">
    <Items>
      <xsl:apply-templates select="@*|node()"/>
    </Items>
  </xsl:template>

  <xsl:template match="ITEM_NAME">
    <xsl:copy>
      <xsl:value-of select="." />
      <xsl:if test="count(key('keyItemName', .)) > 1">
        <xsl:value-of select="concat('-', count(preceding::ITEM_NAME[. = current()]) + 2)"/>
      </xsl:if>
    </xsl:copy>
  </xsl:template>
</xsl:stylesheet>

在样本输入上运行时,会产生:

<Items>
  <Item>
    <ITEM_CODE>ITEM_CODE</ITEM_CODE>
    <ITEM_NAME>ITEM_NAME</ITEM_NAME>
    <ITEM_ALTERNATE_NAME>ITEM_ALTERNATE_NAME</ITEM_ALTERNATE_NAME>
    <ITEM_CATEGORY_CODE>ITEM_CATEGORY_CODE</ITEM_CATEGORY_CODE>
  </Item>
  <Item>
    <ITEM_CODE>15031</ITEM_CODE>
    <ITEM_NAME>Outer Carton-2</ITEM_NAME>
    <ITEM_ALTERNATE_NAME />
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
  </Item>
  <Item>
    <ITEM_CODE>150529</ITEM_CODE>
    <ITEM_NAME>Outer Carton-3</ITEM_NAME>
    <ITEM_ALTERNATE_NAME />
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
  </Item>
  <Item>
    <ITEM_CODE>150999</ITEM_CODE>
    <ITEM_NAME>Outer Carton-4</ITEM_NAME>
    <ITEM_ALTERNATE_NAME />
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
  </Item>
  <Item>
    <ITEM_CODE>150988</ITEM_CODE>
    <ITEM_NAME>test</ITEM_NAME>
    <ITEM_ALTERNATE_NAME />
    <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
  </Item>
</Items>

答案 1 :(得分:0)

您当前的密钥似乎加入了 ITEM_NAME ITEM_CODE ,但看起来您只想 ITEM_NAME

<xsl:key name="keyItemName" match="ITEM_NAME" use="."/>

看起来您希望后缀的编号基于父元素的位置。实现此目的的一种方法是使模板与元素匹配,然后将数字作为参数传递给后续的数学模板

<xsl:template match="Item">
   <Item>
      <xsl:apply-templates select="@*|node()">
          <xsl:with-param name="number">
            <xsl:number/>
         </xsl:with-param>
      </xsl:apply-templates>
   </Item>
</xsl:template>

然后,您需要一个模板来匹配发生重复的 ITEM_NAME 元素。这可以通过检查组中至少为键定义的第二个元素来完成:

<xsl:template match="ITEM_NAME[key('keyItemName', .)[2]]">
   <xsl:param name="number"/>

然后,您可以输出带后缀的元素。

这是完整的XSLT

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
   <xsl:output encoding="UTF-8" method="xml" indent="yes"/>

   <xsl:key name="keyItemName" match="ITEM_NAME" use="."/>

   <xsl:template match="@*|node()">
      <xsl:copy>
         <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
   </xsl:template>

   <xsl:template match="Item">
      <Item>
         <xsl:apply-templates select="@*|node()">
            <xsl:with-param name="number">
               <xsl:number/>
            </xsl:with-param>
         </xsl:apply-templates>
      </Item>
   </xsl:template>

   <xsl:template match="ITEM_NAME[key('keyItemName', .)[2]]">
      <xsl:param name="number"/>
      <ITEM_NAME>
         <xsl:value-of select="concat(.,'-',$number)"/>
      </ITEM_NAME>
   </xsl:template>
</xsl:stylesheet>

应用于XML时,输出以下内容

<Items>
   <Item>
      <ITEM_CODE>ITEM_CODE</ITEM_CODE>
      <ITEM_NAME>ITEM_NAME</ITEM_NAME>
      <ITEM_ALTERNATE_NAME>ITEM_ALTERNATE_NAME</ITEM_ALTERNATE_NAME>
      <ITEM_CATEGORY_CODE>ITEM_CATEGORY_CODE</ITEM_CATEGORY_CODE>
   </Item>
   <Item>
      <ITEM_CODE>15031</ITEM_CODE>
      <ITEM_NAME>Outer Carton-2</ITEM_NAME>
      <ITEM_ALTERNATE_NAME/>
      <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
   </Item>
   <Item>
      <ITEM_CODE>150529</ITEM_CODE>
      <ITEM_NAME>Outer Carton-3</ITEM_NAME>
      <ITEM_ALTERNATE_NAME/>
      <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
   </Item>
   <Item>
      <ITEM_CODE>150999</ITEM_CODE>
      <ITEM_NAME>Outer Carton-4</ITEM_NAME>
      <ITEM_ALTERNATE_NAME/>
      <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
   </Item>
   <Item>
      <ITEM_CODE>150988</ITEM_CODE>
      <ITEM_NAME>test</ITEM_NAME>
      <ITEM_ALTERNATE_NAME/>
      <ITEM_CATEGORY_CODE>52401</ITEM_CATEGORY_CODE>
   </Item>
</Items>