使用XSLT安全地截断HTML格式的文本

时间:2011-10-04 14:03:01

标签: xslt

我需要截断一些使用XSLT 1.0通过HTML格式化的文本;但是,我需要确保所有打开的标签在我的限制结束时关闭。

目前,我已经能够将文本修剪为设置的字符限制,但是超出限制的任何html标记都没有正确关闭,从而导致与其他公告不匹配的格式。

示例:

<div><p>This is my example</p></div>

如果我将字符数限制设为12,我将留下:

<div><p>This

我真正需要的是看起来更像这样:

<div><p>This</p></div>

这就是我目前用于截断文本的代码,但它不能安全地保留html结束标记:

<xsl:strip-space elements="*"/>

<!-- limit: the truncation limit -->
<xsl:variable name="limit" select="600"/>

<!-- t: Total number of characters in the set -->
<xsl:variable name="t" select="string-length(normalize-space(//body))"/>

<xsl:template match="@Body" mode="truncate">
        <xsl:variable name="preceding-strings">
                <xsl:copy-of select="preceding::text()[ancestor::body]"/>
        </xsl:variable>

        <!-- p: number of characters up to the current node -->
        <xsl:variable name="p" select="string-length(normalize-space($preceding-strings))"/>

        <xsl:if test="$p &lt; $limit">
                <xsl:element name="{name()}">
                        <xsl:apply-templates select="@*" mode="truncate"/>
                        <xsl:apply-templates mode="truncate"/>
                </xsl:element>
        </xsl:if>
</xsl:template>

<xsl:template match="text()" mode="truncate">
        <xsl:variable name="preceding-strings">
                <xsl:copy-of select="preceding::text()[ancestor::body]"/>
        </xsl:variable>

        <!-- p: number of characters up to the current node -->
        <xsl:variable name="p" select="string-length(normalize-space($preceding-strings))"/>

        <!-- c: number of characters including current node -->
        <xsl:variable name="c" select="$p + string-length(.)"/>

        <xsl:choose>
                <xsl:when test="$limit &lt;= $c">
                        <xsl:value-of select="substring(., 1, ($limit - $p))"/>
                        <xsl:text>&#8230;</xsl:text>
                </xsl:when>
                <xsl:otherwise>
                        <xsl:value-of select="."/>
                </xsl:otherwise>
        </xsl:choose>
</xsl:template>

<xsl:template match="@*" mode="truncate">
        <xsl:attribute name="{name(.)}"><xsl:value-of select="."/></xsl:attribute>
</xsl:template>

1 个答案:

答案 0 :(得分:3)

我认为您可能会受到XSLT默认规则的攻击,该规则剥离了标记并仅返回文本。要维护标记,您需要包含以下规则:

  <xsl:template match="*">
    <xsl:copy>
      <xsl:apply-templates/>
    </xsl:copy>
  </xsl:template>

我能够简化您的代码并让它像这样工作:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  <xsl:strip-space elements="*"/>

  <!-- limit: the truncation limit -->
  <xsl:variable name="limit" select="12"/>

  <xsl:template match="text()">
    <xsl:variable name="preceding-strings">
      <xsl:copy-of select="preceding::text()[ancestor::body]"/>
    </xsl:variable>

    <!-- p: number of characters up to the current node -->
    <xsl:variable name="p" select="string-length(normalize-space($preceding-strings))"/>

    <!-- c: number of characters including current node -->
    <xsl:variable name="c" select="$p + string-length(.)"/>

    <xsl:choose>
      <xsl:when test="$limit &lt;= $c">
        <xsl:value-of select="substring(., 1, ($limit - $p))"/>
        <xsl:text>&#8230;</xsl:text>
      </xsl:when>
      <xsl:otherwise>
        <xsl:value-of select="."/>
      </xsl:otherwise>
    </xsl:choose>
  </xsl:template>

  <xsl:template match="*">
    <xsl:copy>
      <xsl:apply-templates/>
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>