XSLT:字符(en-dash)编码

时间:2012-08-15 08:03:16

标签: encoding character-encoding xslt-1.0

我陷入了非常严重的问题,请帮助我。

我的输入文件包含一些字符(en-dash), SWITCH - 以太网访问是以下输入数据中包含字符的字段。

<CsvData><![CDATA[Type=Upload Centers

, Corporation,69,SWITCH - Dune,R&D,DNX
,Corporation,70,SWITCH – Ethernet Access,R&D,EA
,Canada Ltd.,70,SWITCH – Ethernet Access,R&D,EA
, Networking Technology (Shanghai) Co. Ltd.,70,SWITCH – Ethernet Access,R&D,EA
, Japan G.K.,70,SWITCH – Ethernet Access,R&D,EA
, Corporation,55,Network - Switch,R&D,XGS
]]></CsvData>

当我使用我的XSLT进行转换时,我收到以下错误。

ERROR: XSLT Service failed. Failed to transform document Exception: Invalid byte 1 of 1-byte UTF-8 sequence.

以下是XSLT代码:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output method="xml" encoding="UTF-8" omit-xml-declaration="yes" cdata-section-     elements="CsvData"/>
    <xsl:param name="UserName"/>
    <xsl:param name="Password"/>
    <xsl:template match="/">    
        SOAPAction: "urn:upload"
        Content-Type: text/xml;charset=UTF-8
        <xsl:text>
        </xsl:text>
        <soapenv:Envelope xmlns:soapenv="http://schemas/" xmlns:web="http:/site">
            <xsl:text>
            </xsl:text>
            <soapenv:Header/>
            <xsl:text>
            </xsl:text>
            <soapenv:Body>
                <xsl:text>
                </xsl:text>
                <web:upload>
                    <xsl:text>
                    </xsl:text>     
                    <web:username><xsl:value-of select="$UserName"/>      </web:username>
                    <xsl:text>
                    </xsl:text>
                    <web:password><xsl:value-of select="$Password"/>     </web:password>
                    <xsl:text>
                    </xsl:text>

                    <web:data>
                    <!-- CDATA section in output file generated -->
                    <xsl:text disable-output-escaping="yes"><![CDATA[ <![CDATA[  ]]>     </xsl:text>
                    <xsl:value-of select="CsvData" />
                    <xsl:text disable-output-escaping="yes"><![CDATA[]]]]><![CDATA[>]]>    </xsl:text>
                </web:data>
            </web:upload></soapenv:Body>
        </soapenv:Envelope>
    </xsl:template>
</xsl:stylesheet>

如果在UTF-8中支持en-dash,请查找为什么此XSLT代码失败的原因。

1 个答案:

答案 0 :(得分:2)

可能的原因是输入文件实际上不是UTF-8编码的。如果它实际上是windows-1252(Windows Latin 1)编码,则EN DASH以八位字节96(十六进制)出现在其中;当数据被解释为UTF-8时,它会导致错误情况,就像报告的情况一样。

要检查此信息,请打开输入文件,例如在Notepad ++中,将编码设置为ANSI。如果它看起来没问题(你希望它有EN DASH),那么我的分析是正确的,你需要用Notepad ++中的命令将文件转换为UTF-8,然后保存它。

有很多方法可以改变文件的编码,我刚才提到了一个简单的方法。如果文件是动态生成的,则需要修改生成过程 - 或者将文件声明为windows-1252编码,尽管这通常不是一个好主意(限制可以使用的字符库)。