XSLT不编码双字节字符

时间:2013-06-20 21:37:33

标签: c# xml xslt encoding

我正在研究一个查看器,使用xslt将xml日志文件显示为html。我的本地化一切都很顺利。生成的HTML文件有一个'³',其中一些双字节字符应该是。我无法弄清楚我做错了什么。

这是一个精简的XSLT文件:

<?xml version="1.0" encoding="utf-8"?>

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:fn="http://www.w3.org/2005/02/xpath-functions">

  <xsl:output method="html" version="4.0" encoding="utf-8" indent="yes"/>

  <xsl:variable name="language" select="nbklog/@language" />  
  <xsl:variable name="dictionaryName">
    dictionary_<xsl:value-of select="$language"/>.xml
  </xsl:variable>
  <xsl:variable name="dictionary" select="document($dictionaryName)" />

  <xsl:template match="/nbklog">
    <html>
      <body>          
        <h2>       
          <xsl:value-of select="$dictionary//String[@Key=$jobType]" /> 
        </h2>
      </body>
    </html>
  </xsl:template>
</xsl:stylesheet>

这是一个用于本地化的字典xml文件:

<?xml version="1.0" encoding="utf-8"?>
  <Dictionary xml:lang="es-ES">
    <String Key="Application">
      Applicación
    </String>
  </Dictionary>

以下是要转换的xml文件示例:

<?xml version="1.0" encoding="utf-8"?>
<nbklog id="51b654d4" jobType="backup" language="es-ES" version="1.0">
    <deviceName>c:\</deviceName>
    ....
</nbklog>

我正在执行以下c#代码的转换:

 string theOutputHtml;

 using (MemoryStream ms = new MemoryStream()) {
     using (XmlTextWriter writer = new XmlTextWriter(ms, Encoding.UTF8)) {

         XPathDocument theDocument = new XPathDocument(inXmlFilename);

         // Load the style sheet and run the transformation.
         XslCompiledTransform theXslTrasform = new XslCompiledTransform();
         theXslTrasform.Load(inXsltFilename, XsltSettings.TrustedXslt, null);
         theXslTrasform.Transform(theDocument, writer);

         ms.Position = 0;

         using (StreamReader theReader = new StreamReader(ms)) {
             theOutputHtml = theReader.ReadToEnd();
         }
     }
 }

theOutputHtml的内容将有一个'³'而不是'ó'。

修改

在html字符串中的and标签之间添加此项解决了我的问题:

 <meta http-equiv='Content-Type' content='text/html;charset=UTF-8'>

2 个答案:

答案 0 :(得分:1)

new XmlTextWriter(ms, Encoding.ASCII)更改为new XmlTextWriter(ms, Encoding.UTF8)

<强>更新

另一个可能的问题是,尽管您的XML文件具有encoding="utf-8"声明,但实际上文件可能并未使用该编码进行保存。检查所有XML文件的编码是否与其声明的编码匹配。就个人而言,我更喜欢废除声明编码,以便可以自动检测它。

答案 1 :(得分:1)

很明白,因为您使用了错误的编码,请尝试以下方法:

using (XmlTextWriter writer = new XmlTextWriter(ms, Encoding.Unicode))