保存XmlDocument时,它忽略XmlDeclaration(UTF8)中的编码并使用UTF16

时间:2010-11-02 03:04:47

标签: c# xml

我有以下代码:

var doc = new XmlDocument();

XmlDeclaration xmlDeclaration = doc.CreateXmlDeclaration("1.0", "UTF-8", null);
doc.AppendChild(xmlDeclaration);

XmlElement root = doc.CreateElement("myRoot");
doc.AppendChild(root);
root.InnerText = "myInnerText";

StringWriter sw = new StringWriter();
doc.Save(sw);
Console.WriteLine(sw.ToString());

Console.WriteLine();

MemoryStream ms = new MemoryStream();
doc.Save(ms);
Console.WriteLine(Encoding.ASCII.GetString(ms.ToArray()));

这是输出:

<?xml version="1.0" encoding="utf-16"?>
<myRoot>myInnerText</myRoot>

???<?xml version="1.0" encoding="UTF-8"?>
<myRoot>myInnerText</myRoot>

它基本上是做一个xml文件,并将编码设置为utf8,但是当它将它保存到字符串写入器时,它会忽略我的编码并使用utf16。但是,在使用内存流时,它使用utf8(带有额外的BOM表字符)

这是为什么?为什么不遵守utf-8的显式编码设置?

非常感谢

3 个答案:

答案 0 :(得分:29)

因为您所做的只是设置一个说明为UTF-8的XML元素,所以您实际上并没有将其保存为UTF-8。您需要将输出流设置为使用UTF-8,如下所示:

var doc = new XmlDocument();
XmlElement root = doc.CreateElement("myRoot");
doc.AppendChild(root);
root.InnerText = "myInnerText";
using(TextWriter sw = new StreamWriter("C:\\output.txt", false, Encoding.UTF8)) //Set encoding
{
    doc.Save(sw);
}

一旦这样做,您甚至不必添加XML声明。它自己解决了这个问题。如果要将其保存到MemoryStream,请使用包装MemoryStream的StreamWriter。

答案 1 :(得分:4)

我使用以下方法,它以的形式将其写成UTF-8

public static string Beautify(XmlDocument doc)
{
    string xmlString = null;
    using (MemoryStream ms = new MemoryStream()) {
        XmlWriterSettings settings = new XmlWriterSettings {
            Encoding = new UTF8Encoding(false),
            Indent = true,
            IndentChars = "  ",
            NewLineChars = "\r\n",
            NewLineHandling = NewLineHandling.Replace
        };
        using (XmlWriter writer = XmlWriter.Create(ms, settings)) {
            doc.Save(writer);
        }
        xmlString = Encoding.UTF8.GetString(ms.ToArray());
    }
    return xmlString;
}

称之为:

File.WriteAllText(fileName, Utilities.Beautify(xmlDocument));

答案 2 :(得分:2)

the MSDN我们可以看到......

  

TextWriter上的编码确定写出的编码(XmlDeclaration节点的编码由TextWriter的编码替换)。如果TextWriter上没有指定编码,则保存XmlDocument而不使用编码属性。

如果要使用XmlDeclaration中的编码,则需要使用流来保存文档。