.NET XmlDocument:保存后为什么DOCTYPE会发生变化?

时间:2008-11-12 15:57:56

标签: c# xml vb.net doctype xmldocument

我正在使用.NET XmlReader打开XML文件并将文件保存在另一个文件名中,似乎DOCTYPE声明在两个文件之间发生了变化。虽然新保存的文件仍然是有效的XML,但我想知道为什么它坚持要更改原始标签。

Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True

Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)

以下(原始文件中):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">

成为(注意结尾处的[]字符):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>

3 个答案:

答案 0 :(得分:8)

设置XmlDocument.XmlResolver = null时,System.Xml中存在错误。解决方法是创建自定义XmlTextWriter:

    private class NullSubsetXmlTextWriter : XmlTextWriter
    {
        public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
            : base(inputFileName, encoding)
        {
        }
        public override void WriteDocType(string name, string pubid, string sysid, string subset)
        {
            if (subset == String.Empty)
            {
                subset = null;
            }
            base.WriteDocType(name, pubid, sysid, subset);
        }
    }

在您的代码中,创建一个新的NullSubsetXmlTextWriter(pathToNewXml,Encoding.UTF8)并将该对象传递给oDoc.Save()方法。

以下是Microsoft support case,您可以在其中了解解决方法(它描述了解决方法,但未提供代码)。

答案 1 :(得分:1)

该库可能会将DOCTYPE元素解析为内部结构,然后将结构转换回文本。它不存储原始字符串形式。

答案 2 :(得分:0)

这是最适合您的解决方案:

writer.WriteDocType("Name", Nothing, 
                    "http://xml.cxml.org/schemas/cXML/1.2.033/Fulfill.dtd", Nothing) 

如果您使用Nothing,则不会获得[]或“”等