XSLT将Unicode字符转换为可视字符

时间:2014-05-15 08:02:28

标签: xslt xpath xslt-1.0

我是XSLT的新手,我遇到的问题是,在XML上应用XSLT样式表后,包含β之类的unicodes,在输出XML中转换为β。我需要的是防止XSLT样式表将Unicodes转换为可视字符。

任何帮助我将不胜感激。 谢谢,

1 个答案:

答案 0 :(得分:3)

与DOM不同,XPath使用的对象模型认为所有实体和CDATA部分都已解析。这意味着XPath会将您在源文档中看到的β读作字符β。所以XLST并没有真正转换任何东西。它只是读取并输出XPath选择的值。

可以使用XSLT将β表示为结果文档中的字符实体。您可以通过在encoding中声明非UTF <xsl:output>来选择该行为,例如&#34; US-ASCII&#34;或&#34; ISO-8859-1&#34;。

假设你有这个来源:

<character>&#x03B2;</character>

将此样式表与<xsl:output encoding="iso-8859-1" />一起使用:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output method="xml" indent="yes" encoding="iso-8859-1" />
    <xsl:template match="character">
        <result><xsl:value-of select="."/></result>
    </xsl:template>
</xsl:stylesheet>

根据处理器的实施情况,您可能会得到

<result>&#946;</result>

<result>&#x3b2;</result>

两者都代表相同的角色。

我不确定,但如果您将xsl:outputmethod="html"属性一起使用,我认为该行为在XSLT 1.0处理器中是默认行为。