XSL转换XML只过滤掉元素和属性值?

时间:2012-09-07 21:58:17

标签: xml xslt localization xmldiff

我需要将以下XML转换为具有相同元素和属性的XML,除了可以本地化的值 - 基本上是英语短语。

某些元素(<footnote>)和属性是可选的(<display_data_type>),我希望能够做到这一点 - 没有每个元素的模板。这可能吗?

最终目标是能够将XML的默认版本与本地化版本进行比较,忽略本地化的字符串。

例如以下内容:

<data_schema>
    <field symbol="ACCOUNT" type="string" name="Account Number">
        <validators>
            <maxlength>6</maxlength>
        </validators>
        <description>The account number</description>
        <example>123456</example>
        <default_value></default_value>
    </field>
    <field symbol="POSTAL_CODE" type="string" name="Postal Code">
        <description>Postal Code for account</description>
        <example>22022</example>
        <footnote>Does not apply to certain accounts</footnote>
        <default_value></default_value>
    </field>
    <field symbol="DISCOUNT" type="string" name="Discount Percentage" display_data_type="percentage">
        <description>Descount determined by account</description>
        <example>1.5%</example>
        <default_value></default_value>
    </field>
</data_schema>

将转换为:

<data_schema>
    <field symbol="ACCOUNT" type="string" name="">
        <validators>
            <maxlength>6</maxlength>
        </validators>
        <description/>
        <example/>
        <default_value/>
    </field>
    <field symbol="POSTAL_CODE" type="string" name="">
        <description/>
        <example/>
        <footnote/>
        <default_value/>
    </field>
    <field symbol="DISCOUNT" type="string" name="" display_data_type="percentage">
        <description/>
        <example/>
        <default_value/>
    </field>
</data_schema>

2 个答案:

答案 0 :(得分:4)

这是另一种方法。这个基于“身份转换”的XSLT设计模式,它基本上只是按原样复制所有节点。

<xsl:template match="@*|node()">
   <xsl:copy>
      <xsl:apply-templates select="@*|node()"/>
   </xsl:copy>
</xsl:template>

您可以对此进行扩展,以添加其他模板匹配项以匹配您要对其执行特定操作的节点,在您的情况下,将删除文本。所需的模板取决于转换的确切规则。

如果您希望从特定元素和属性中删除文本,您可以添加以下两个模板,以复制节点但不包含文本:

<xsl:template match="description|example|footnote|default_value">
   <xsl:copy/>
</xsl:template>

<xsl:template match="@name">
   <xsl:attribute name="{name()}"/>
</xsl:template>

因此,在这种情况下,元素描述示例脚注 default_value 会删除其文字,以及 @name 属性。所有其他节点将按原样复制,并带有文本。

另一方面,如果你想要一个特定的元素和属性列表,你可以添加像这样的模板

<xsl:template match="field/*[not(self::validators)]">
   <xsl:copy/>
</xsl:template>

<xsl:template match="@symbol|@type|@display_data_type">
   <xsl:copy/>
</xsl:template>

<xsl:template match="@*">
   <xsl:attribute name="{name()}"/>
</xsl:template>

因此,对于验证器元素,您实际上是在说,删除所有不是验证器元素的内容。 验证器元素将由身份转换模板复制。对于属性,我已经展示了一种略有不同的方法,其中已经明确列出了要保留的属性,并且您有第二个模板可以从其他所有文本中删除文本。

在这种情况下,这是两个完整的XSLT。

第一个从特定节点删除文本

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output method="xml" indent="yes"/>

   <xsl:template match="description|example|footnote|default_value">
      <xsl:copy/>
   </xsl:template>

   <xsl:template match="@name">
      <xsl:attribute name="{name()}"/>
   </xsl:template>

   <xsl:template match="@*|node()">
      <xsl:copy>
         <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
   </xsl:template>
</xsl:stylesheet>

第二个用于在特定节点中保留文本

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output method="xml" indent="yes"/>

   <xsl:template match="field/*[not(self::validators)]">
      <xsl:copy/>
   </xsl:template>

   <xsl:template match="@symbol|@type|@display_data_type">
      <xsl:copy/>
   </xsl:template>

   <xsl:template match="@*">
      <xsl:attribute name="{name()}"/>
   </xsl:template>

   <xsl:template match="node()">
      <xsl:copy>
         <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
   </xsl:template>
</xsl:stylesheet>

对于样本文档,两者都应生成相同的输出:

<data_schema>
   <field symbol="ACCOUNT" type="string" name="">
      <validators>
         <maxlength>6</maxlength>
      </validators>
      <description/>
      <example/>
      <default_value/>
   </field>
   <field symbol="POSTAL_CODE" type="string" name="">
      <description/>
      <example/>
      <footnote/>
      <default_value/>
   </field>
   <field symbol="DISCOUNT" type="string" name="" display_data_type="percentage">
      <description/>
      <example/>
      <default_value/>
   </field>
</data_schema>

答案 1 :(得分:1)

这是一个例子。应用此类模板时,应创建树的副本,减去非符号或类型的属性的文本区域和属性文本。

<xsl:template match="*">
  <xsl:element name="{name()}">
    <xsl:for-each select="@*">
      <xsl:choose>
        <xsl:when test="name() = 'symbol' or name() = 'type'">
          <xsl:copy-of select="."/>
        </xsl:when>
        <xsl:otherwise>
          <xsl:attribute name="{name()}"/>
        </xsl:otherwise>
      </xsl:choose>
    </xsl:for-each>  

    <xsl:apply-templates select="*"/>
  </xsl:element>
</xsl:template>