XSLT - 重命名节点并删除空格以及更多内容

时间:2012-12-10 10:33:07

标签: xml xslt

这是一个非常复杂的问题,超出了我对XSLT的了解 - 我还在学习,无论我通过O'Reilly的XSLT书读到多少,我都在脑海中。

我有一个多方面的问题,我已经为它生成了一个输入XML文件,我将尝试解释之后的要求。

INPUT

<roottag>
<body>
    <header>
        <r>
            <c>
                <d>Header Tag</d><!-- This can include spaces-->
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Header Tag A</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Header Value A</d>
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Header Tag B</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Header Value B</d>
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Header Tag C</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Header Value C</d>
                <e>System generated trash</e>
            </c>
        </r>
    </header>
    <information>
        <r>Body of document</r>
        <r>Appears here but have an XSLT that deals with this</r>
    </informtaion>
    <footer>
        <r>
            <c>
                <d>Footer Tag</d><!-- This can include spaces-->
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Footer Tag A</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Footer Value A</d>
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Footer Tag B</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Footer Value B</d>
                <e>System generated trash</e>
            </c>
        </r>
        <r>
            <c>
                <d>Sub Footer Tag C</d>
                <e>System generated trash</e>
            </c>
            <c>
                <d>Sub Footer Value C</d>
                <e>System generated trash</e>
            </c>
        </r>
    </footer>
</body>
</roottag>

输出

<?xml version="1.0" encoding="utf-8"?>
<roottag>
  <body>
    <header>
      <HeaderTag>
        <!-- without spaces -->
        <HeaderName>Header Tag</HeaderName>
        <!-- This needs to preserve spaces-->
      </HeaderTag>
      <SubHeaderTagA>
        <!-- without spaces -->
        <HeaderName>Sub Header Tag A</HeaderName>
        <!-- This needs to preserve spaces-->
        <HeaderValue>Sub Header Value A</HeaderValue>
      </SubHeaderTagA>
      <SubHeaderTagB>
        <HeaderName>Sub Header Tag B</HeaderName>
        <HeaderValue>Sub Header Value B</HeaderValue>
      </SubHeaderTagB>
      <SubHeaderTagC>
        <HeaderName>Sub Header Tag C</HeaderName>
        <HeaderValue>Sub Header Value C</HeaderValue>
      </SubHeaderTagC>
    </header>
    <information>
      <r>Body of document</r>
      <r>Appears here but have an XSLT that deals with this</r>
      </information>
      <footer>
        <FooterTag>
          <FooterName>Footer Tag</FooterName>
        </FooterTag>
        <SubFooterTagA>
          <FooterName>Sub Footer Tag A</FooterName>
          <FooterValue>Sub Footer Value A</FooterValue>
        </SubFooterTagA>
        <SubFooterTagB>
          <FooterName>Sub Footer Tag B</FooterName>
          <FooterValue>Sub Footer Value B</FooterValue>
        </SubFooterTagB>
        <SubFooterTagC>
          <FooterName>Sub Footer Tag C</FooterName>
          <FooterValue>Sub Footer Value C</FooterValue>
        </SubFooterTagC>
      </footer>
    </body>
</roottag>

所以要解释我所看到的问题,以及我遇到的问题。

  1. 正在删除空间: roottag / body / header / r / c / d中保存的值可以并且通常包含空格,因此我需要一种方法来删除我从网站[addLink]上的问题中找到的内容,但是这也取代了值,所以当我稍后在过程中使用数据,它没有输出所需的空格。
  2. 仅用第一个值替换R: 我不知道如何做到这一点,我尝试和研究过的所有内容似乎都使用第二个值作为值。我正处于危险之中。
  3. 页眉或页脚名称/值: 同样,如果可能的话,我的知识是有限的,或者每个标签都需要单独匹配?

  4. 页眉和页脚标记的移动: 我没有把它包含在我要求的输出中,但我想我可能需要这样做 - 是否可以将标题标签和页脚标签移到body标签之外?所以XML将是:roottag-header-body-information- / body-footer / - / rt

  5. 如果您需要更多说明,请告诉我。

2 个答案:

答案 0 :(得分:2)

从源代码中的元素内容中获取元素名称通常是一个坏主意 - 尽管您可以删除空格,但总是存在其他特殊字符的可能性,即使您将其全部删除,也可能最终导致意外重复。例如,包含1 Tag2 Tag的两个元素都需要拆分为Tag

但是,这样的事情应该可以胜任:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="xml" indent="yes"/>
  <xsl:strip-space elements="*" />

  <xsl:variable name="allowed">ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvxyz_</xsl:variable>

  <xsl:template match="r[c/d]">
    <xsl:variable name="elemName" select="translate(c/d,translate(c/d,$allowed,''),'')" />
    <xsl:element name="{$elemName}">
      <xsl:apply-templates />
    </xsl:element>
  </xsl:template>

  <xsl:template match="c">
    <xsl:apply-templates select="@* | node()"/>
  </xsl:template>

  <xsl:template match="c[1]/d">
    <HeaderName>
      <xsl:apply-templates />
    </HeaderName>
  </xsl:template>

  <xsl:template match="c[2]/d">
    <HeaderValue>
      <xsl:apply-templates />
    </HeaderValue>
  </xsl:template>

  <xsl:template match="e" />

  <xsl:template match="@* | node()">
    <xsl:copy>
      <xsl:apply-templates select="@* | node()"/>
    </xsl:copy>
  </xsl:template>
</xsl:stylesheet>

这使用'double translate'方法从字符串中去除所有不需要的字符。 translate函数可用于从列表中删除所有字符,方法是指定一个空字符串以将这些字符转换为。您可以使用它从字符串中删除所有VALID字符,只留下一个只包含INVALID字符的字符串。然后,您再次使用translate从原始字符串中删除所有这些INVALID字符。

如果您确实需要在正文之外添加页眉/页脚,请添加以下模板:

<xsl:template match="roottag">
  <xsl:copy>
    <xsl:apply-templates select="body/header" />
    <xsl:apply-templates select="body" />
    <xsl:apply-templates select="body/footer" />
  </xsl:copy>
</xsl:template>

<xsl:template match="body">
  <xsl:copy>
    <xsl:apply-templates select="information" />
  </xsl:copy>
</xsl:template>

要忽略r包含等号的c\d个节点,请将此模板添加到与“r[c/d]”匹配的模板下方:

<xsl:template match="r[contains(c/d,'=')]" />

答案 1 :(得分:1)

好吧有多个问题!所以多个答案..我会尽可能系统地写,希望你理解它!并随意提问!!

1.第一步是清除标签之间的其他不需要的空格。为了达到这个目的,在XML声明的正下方有两个语句作为标题:

  <xsl:output method="xml" indent="yes"/>
  <xsl:strip-space elements="*"/>

2.接下来是定义temlpate的身份!它的工作是从输入中输出(除了命令不输出)

  <xsl:template match="@* | node()">
    <xsl:copy>
      <xsl:apply-templates select="@* | node()"/>
    </xsl:copy>
  </xsl:template>

3.在您的输出中,您不希望看到<r>元素!所以我们将有以下几行

  <xsl:template match="/roottag/body/header/r
                      |/roottag/body/footer/r">
    <xsl:apply-templates select="@*|node()"/>
  </xsl:template>

这不会复制<r>元素,但让子元素接管!!我将在下面写下..

4.您只想复制每个<c>元素中的第一个<r>标记..并忽略输出中的其余<c>个节点。所以在下面定义模板 - 覆盖..

  <xsl:template match="/roottag/body/header/r/c
                      |/roottag/body/footer/r/c"/>

这实际上会从输出中删除所有<c>个元素!但是在覆盖之下只会处理第一个<c>元素!

5.此代码用于在输出中构建<Header>元素!

  <xsl:template match="/roottag/body/header/r/c[1]">
    <xsl:variable name="ElementName">
      <xsl:call-template name="RemoveSpaceFromValueD">
        <xsl:with-param name="text" select="d/."/>
        <xsl:with-param name="replace" select="' '"/>
      </xsl:call-template>
    </xsl:variable>

    <xsl:element name="{$ElementName}">
      <xsl:element name="HeaderName">
        <xsl:value-of select="d/."/>
      </xsl:element>
      <xsl:if test="ancestor::r != ancestor::header/r[1]">
      <xsl:element name="HeaderValue">
        <xsl:value-of select="e/."/>
      </xsl:element>
      </xsl:if>
    </xsl:element>
  </xsl:template>

通过使用此代码,您不必为不同的<header>, <footer> and <subHeaderTag>s

声明不同的模板

我在这里做的是:

  1. 调用新模板RemoveSpaceFromValueD,该模板将复制元素d中的文字,从文本中删除空格并将其分配给变量ElementName
  2. 使用变量ElementName中的值将用于创建新元素!因此Sub Header Tag C<SubHeaderTagC>作为父母:)
  3. <d>的值复制到<HeaderName>
  4. 将下一个<d>的下一个<c>复制到<HeaderValue>
  5. 6.重复<Footer>的相同代码。

      <xsl:template match="/roottag/body/footer/r/c[1]">
        <xsl:variable name="ElementName">
          <xsl:call-template name="RemoveSpaceFromValueD">
            <xsl:with-param name="text" select="d/."/>
            <xsl:with-param name="replace" select="' '"/>
          </xsl:call-template>
        </xsl:variable>
    
        <xsl:element name="{$ElementName}">
          <xsl:element name="FooterName">
            <xsl:value-of select="d/."/>
          </xsl:element>
          <xsl:if test="ancestor::r != ancestor::footer/r[1]">
            <xsl:element name="FooterValue">
              <xsl:value-of select="e/."/>
            </xsl:element>
          </xsl:if>
        </xsl:element>
    
      </xsl:template>
    

    7.和模板RemoveSpaceFromValueD

      <xsl:template name="RemoveSpaceFromValueD">
        <xsl:param name="text"/>
        <xsl:param name="replace"/>
        <xsl:choose>
          <xsl:when test="contains($text,$replace)">
            <xsl:value-of select="substring-before($text,$replace)"/>
            <xsl:call-template name="RemoveSpaceFromValueD">
              <xsl:with-param name="text" select="substring-after($text,$replace)"/>
              <xsl:with-param name="replace" select="$replace"/>
            </xsl:call-template>
          </xsl:when>
          <xsl:otherwise>
            <xsl:value-of select="$text"/>
          </xsl:otherwise>
        </xsl:choose>
      </xsl:template>
    

    8.整个XSLT代码如下所示:

    测试一下!如果您对理解有任何疑问或困难,请告诉我。

    <?xml version="1.0" encoding="utf-8"?>
    <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
      <xsl:output method="xml" indent="yes"/>
      <xsl:strip-space elements="*"/>
    
    
      <xsl:template match="@* | node()">
        <xsl:copy>
          <xsl:apply-templates select="@* | node()"/>
        </xsl:copy>
      </xsl:template>
    
    
      <xsl:template match="/roottag/body/header/r
                          |/roottag/body/footer/r">
        <xsl:apply-templates select="@*|node()"/>
      </xsl:template>
    
    
      <xsl:template match="/roottag/body/header/r/c
                          |/roottag/body/footer/r/c"/>
    
    
      <xsl:template match="/roottag/body/header/r/c[1]">
        <xsl:variable name="ElementName">
          <xsl:call-template name="RemoveSpaceFromValueD">
            <xsl:with-param name="text" select="d/."/>
            <xsl:with-param name="replace" select="' '"/>
          </xsl:call-template>
        </xsl:variable>
    
        <xsl:element name="{$ElementName}">
          <xsl:element name="HeaderName">
            <xsl:value-of select="d/."/>
          </xsl:element>
          <xsl:if test="ancestor::r != ancestor::header/r[1]">
            <xsl:for-each select="../c[2]">
              <xsl:element name="HeaderValue">
                <xsl:value-of select="d/."/>
              </xsl:element>
            </xsl:for-each>
          </xsl:if>
        </xsl:element>
    
      </xsl:template>
    
    
      <xsl:template match="/roottag/body/footer/r/c[1]">
        <xsl:variable name="ElementName">
          <xsl:call-template name="RemoveSpaceFromValueD">
            <xsl:with-param name="text" select="d/."/>
            <xsl:with-param name="replace" select="' '"/>
          </xsl:call-template>
        </xsl:variable>
    
        <xsl:element name="{$ElementName}">
          <xsl:element name="FooterName">
            <xsl:value-of select="d/."/>
          </xsl:element>
          <xsl:for-each select="../c[2]">
            <xsl:element name="FooterValue">
              <xsl:value-of select="d/."/>
            </xsl:element>
          </xsl:for-each>
        </xsl:element>
    
      </xsl:template>
    
    
      <xsl:template name="RemoveSpaceFromValueD">
        <xsl:param name="text"/>
        <xsl:param name="replace"/>
        <xsl:choose>
          <xsl:when test="contains($text,$replace)">
            <xsl:value-of select="substring-before($text,$replace)"/>
            <xsl:call-template name="RemoveSpaceFromValueD">
              <xsl:with-param name="text" select="substring-after($text,$replace)"/>
              <xsl:with-param name="replace" select="$replace"/>
            </xsl:call-template>
          </xsl:when>
          <xsl:otherwise>
            <xsl:value-of select="$text"/>
          </xsl:otherwise>
        </xsl:choose>
      </xsl:template>
    
    
    </xsl:stylesheet>