XSL字符转义问题

时间:2009-03-14 16:24:53

标签: html xslt escaping

我写这篇文章是因为我真的碰到了墙,无法继续前进。在我的数据库中,我已经像这样转义了HTML:"<p>My name is Freddy and I was"

我想将其显示为HTML或剥离我的XSL模板中的HTML标记。这两种解决方案都适合我,我会选择更快的解决方案。

我在线阅读了几篇帖子但找不到解决方案。我也尝试过disable-output-escape但没有成功。基本上似乎问题是在XSL执行中的某个地方,引擎正在将此<p>更改为:<p>

它正在将&转换为&。如果它有帮助,这是我的XSL代码。我在顶部尝试了几种带有和不带输出标签的组合。

任何帮助将不胜感激。提前谢谢。

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  <xsl:output method="html" omit-xml-declaration="yes"/>

  <xsl:template match="DocumentElement">
    <div>
      <xsl:attribute name="id">mySlides</xsl:attribute>
      <xsl:apply-templates>
        <xsl:with-param name="templatenumber" select="0"/>
      </xsl:apply-templates>
    </div>

    <div>
      <xsl:attribute name="id">myController</xsl:attribute>
      <xsl:apply-templates>
        <xsl:with-param name="templatenumber" select="1"/>
      </xsl:apply-templates>
    </div>
  </xsl:template>

  <xsl:template match="DocumentElement/QueryResults">
    <xsl:param name="templatenumber">tobereplace</xsl:param>

    <xsl:if test="$templatenumber=0">
      <div>
        <xsl:attribute name="id">myController</xsl:attribute>
        <div>
          <xsl:attribute name="class">article</xsl:attribute>
          <h2>
            <a>
              <xsl:attribute name="class">title</xsl:attribute>
              <xsl:attribute name="title"><xsl:value-of select="Title"/></xsl:attribute>
              <xsl:attribute name="href">/stories/stories-details/articletype/articleview/articleid/<xsl:value-of select="ArticleId"/>/<xsl:value-of select="SEOTitle"/>.aspx</xsl:attribute>
              <xsl:value-of select="Title"/>
            </a>
          </h2>
          <div>
            <xsl:attribute name="style">text-indent: 25px;</xsl:attribute>
            <xsl:attribute name="class">articlesummary</xsl:attribute>
            <xsl:call-template name="removeHtmlTags">
              <xsl:with-param name="html" select="Summary" />
            </xsl:call-template>
          </div>
        </div>
      </div>
    </xsl:if>
    <xsl:if test="$templatenumber=1">
      <div>
        <xsl:attribute name="id">myController</xsl:attribute>
        <span>
          <xsl:attribute name="class">jFlowControl</xsl:attribute>
          aa
        </span>
      </div>
    </xsl:if>
  </xsl:template>

  <xsl:template name="removeHtmlTags">
    <xsl:param name="html"/>
    <xsl:choose>
      <xsl:when test="contains($html, '&lt;')">
        <xsl:value-of select="substring-before($html, '&lt;')"/>
        <!-- Recurse through HTML -->
        <xsl:call-template name="removeHtmlTags">
          <xsl:with-param name="html" select="substring-after($html, '&gt;')"/>
        </xsl:call-template>
      </xsl:when>
      <xsl:otherwise>
        <xsl:value-of select="$html"/>
      </xsl:otherwise>
    </xsl:choose>
  </xsl:template>
</xsl:stylesheet>

4 个答案:

答案 0 :(得分:18)

假设您有 HTML字符串,

<p>My name is Freddy &amp; I was

然后,如果你将其转义并将其存储在数据库中,它将成为 this

&lt;p&gt;My name is Freddy &amp;amp; I was

因此,如果您将其作为XML检索(不事先取消它),结果将是 this

&amp;lt;p&amp;gt;My name is Freddy &amp;amp;amp; I was

<xsl:value-of select="." disable-output-escaping="yes" />会产生:

&lt;p&gt;My name is Freddy &amp;amp; I was

您获得的数据与数据库完全相同,但当然您会在输出中看到HTML标记。所以你需要的是一个执行以下字符串替换的机制:

  • "&amp;lt;""&lt;"一起(在未转义的输出中有效地将&lt;更改为<
  • "&amp;gt;""&gt;"一起(在未转义的输出中有效地将&gt;更改为>
  • "&amp;quot;""&quot;"一起(在未转义的输出中有效地将&quot;更改为"
  • "&amp;amp;""&amp;"一起(在未转义的输出中有效地将&amp;更改为&

从您的XSL我推断出以下测试输入XML:

<DocumentElement>
  <QueryResults>
    <Title>Article 1</Title>
    <ArticleId>1</ArticleId>
    <SEOTitle>Article_1</SEOTitle>
    <Summary>&amp;lt;p&amp;gt;Article 1 summary &amp;amp;amp; description.&amp;lt;/p&amp;gt;</Summary>
  </QueryResults>
  <QueryResults>
    <Title>Article 2</Title>
    <ArticleId>2</ArticleId>
    <SEOTitle>Article_2</SEOTitle>
    <Summary>&amp;lt;p&amp;gt;Article 2 summary &amp;amp;amp; description.&amp;lt;/p&amp;gt;</Summary>
  </QueryResults>
</DocumentElement>

我更改了您提供的样式表并实现了这样的替换机制。如果您将以下XSLT 1.0模板应用于它:

<xsl:stylesheet
  version="1.0"
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:my="my:namespace"
  exclude-result-prefixes="my"
>

  <xsl:output method="html" omit-xml-declaration="yes"/>

  <my:unescape>
    <my:char literal="&lt;" escaped="&amp;lt;" />
    <my:char literal="&gt;" escaped="&amp;gt;" />
    <my:char literal="&quot;" escaped="&amp;quot;" />
    <my:char literal="&amp;" escaped="&amp;amp;" />
  </my:unescape>

  <xsl:template match="DocumentElement">
    <div id="mySlides">
      <xsl:apply-templates mode="slides" />
    </div>
    <div id="myController">
      <xsl:apply-templates mode="controller" />
    </div>
  </xsl:template>

  <xsl:template match="DocumentElement/QueryResults" mode="slides">
    <div class="article">
      <h2>
        <a class="title" title="{Title}" href="{concat('/stories/stories-details/articletype/articleview/articleid/', ArticleId, '/', SEOTitle, '.aspx')}">
          <xsl:value-of select="Title"/>
        </a>
      </h2>
      <div class="articlesummary" style="text-indent: 25px;">
        <xsl:apply-templates select="document('')/*/my:unescape/my:char[1]">
          <xsl:with-param name="html" select="Summary" />
        </xsl:apply-templates>
      </div>
    </div>
  </xsl:template>

  <xsl:template match="DocumentElement/QueryResults" mode="controller">
    <span class="jFlowControl">
      <xsl:text>aa </xsl:text>
      <xsl:value-of select="Title" />
    </span>
  </xsl:template>

  <xsl:template match="my:char">
    <xsl:param name="html" />
    <xsl:variable name="intermediate">
      <xsl:choose>
        <xsl:when test="following-sibling::my:char">
          <xsl:apply-templates select="following-sibling::my:char[1]">
            <xsl:with-param name="html" select="$html" />
          </xsl:apply-templates>
        </xsl:when>
        <xsl:otherwise>
          <xsl:value-of select="$html" disable-output-escaping="yes" />
        </xsl:otherwise>
      </xsl:choose>
    </xsl:variable>
    <xsl:call-template name="unescape">
      <xsl:with-param name="html" select="$intermediate" />
    </xsl:call-template>
  </xsl:template>

  <xsl:template name="unescape">
    <xsl:param name="html" />
    <xsl:choose>
      <xsl:when test="contains($html, @escaped)">
        <xsl:value-of select="substring-before($html, @escaped)" disable-output-escaping="yes"/>
        <xsl:value-of select="@literal" disable-output-escaping="yes" />
        <xsl:call-template name="unescape">
          <xsl:with-param name="html" select="substring-after($html, @escaped)"/>
        </xsl:call-template>
      </xsl:when>
      <xsl:otherwise>
        <xsl:value-of select="$html" disable-output-escaping="yes"/>
      </xsl:otherwise>
    </xsl:choose>
  </xsl:template>

</xsl:stylesheet>

然后生成这个输出HTML:

<div id="mySlides">
  <div class="article">
    <h2>
      <a class="title" title="Article 1" href="/stories/stories-details/articletype/articleview/articleid/1/Article_1.aspx">Article 1</a>
    </h2>
    <div class="articlesummary" style="text-indent: 25px;">
      <p>Article 1 summary &amp; description.</p>
    </div>
  </div>
  <div class="article">
    <h2>
      <a class="title" title="Article 2" href="/stories/stories-details/articletype/articleview/articleid/2/Article_2.aspx">Article 2</a>
    </h2>
    <div class="articlesummary" style="text-indent: 25px;">
      <p>Article 2 summary &amp; description.</p>
    </div>
  </div>
</div>
<div id="myController">
  <span class="jFlowControl">aa Article 1</span>
  <span class="jFlowControl">aa Article 2</span>
</div>

请注意

  • 使用临时命名空间和嵌入元素(<my:unescape>)创建要替换的字符列表
  • 使用递归来模拟输入中所有受影响字符的迭代替换
  • 使用unescape模板中的隐式上下文来传输当前要替换的字符的信息

另外请注意:

  • 使用模板模式为同一输入获取不同的输出(这取代了您的templatenumber参数)
  • 大部分时间不需要<xsl:attribute>个元素。它们可以安全地替换为内联符号(attributename="{attributevalue}"
  • 使用concat()函数创建网址

一般来说,将转义的HTML存储在数据库中是一个坏主意(更一般地说:将HTML存储在数据库中是一个坏主意。)。你为自己设置了各种各样的问题,这就是其中之一。如果您无法更改此设置,我希望该解决方案可以帮助您。

我不能保证它在所有情况下都做对了,它可能会打开安全漏洞(想想XSS),但处理这个问题并不是问题的一部分。无论如何,请考虑自己警告。

我现在需要休息一下。 ; - )

答案 1 :(得分:6)

您不应将转义的HTML存储在数据库中。如果您的数据库包含实际的“&lt;”字符,然后“禁用 - 输出 - 转义”命令将做你想要的。

如果您无法更改数据,那么在执行转换之前,您必须先取消数据。

答案 2 :(得分:2)

将此行添加到样式表

<xsl:output method="html" indent="yes" version="4.0"/>

答案 3 :(得分:1)

  

将HTML存储在数据库中是个坏主意

什么?那你怎么样存放呢?在XML文档中,您还必须使用XSLT吗?作为Web开发人员,我们一直使用SQL数据库来存储用户定义的HTML数据。只要为您的目的正确消毒,该方法没有任何问题。