我正在使用.NET XmlReader打开XML文件并将文件保存在另一个文件名中,似乎DOCTYPE声明在两个文件之间发生了变化。虽然新保存的文件仍然是有效的XML,但我想知道为什么它坚持要更改原始标签。
Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True
Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)
以下(原始文件中):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">
成为(注意结尾处的[]字符):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
答案 0 :(得分:8)
设置XmlDocument.XmlResolver = null时,System.Xml中存在错误。解决方法是创建自定义XmlTextWriter:
private class NullSubsetXmlTextWriter : XmlTextWriter
{
public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
: base(inputFileName, encoding)
{
}
public override void WriteDocType(string name, string pubid, string sysid, string subset)
{
if (subset == String.Empty)
{
subset = null;
}
base.WriteDocType(name, pubid, sysid, subset);
}
}
在您的代码中,创建一个新的NullSubsetXmlTextWriter(pathToNewXml,Encoding.UTF8)并将该对象传递给oDoc.Save()方法。
以下是Microsoft support case,您可以在其中了解解决方法(它描述了解决方法,但未提供代码)。
答案 1 :(得分:1)
该库可能会将DOCTYPE元素解析为内部结构,然后将结构转换回文本。它不存储原始字符串形式。
答案 2 :(得分:0)
这是最适合您的解决方案:
writer.WriteDocType("Name", Nothing,
"http://xml.cxml.org/schemas/cXML/1.2.033/Fulfill.dtd", Nothing)
如果您使用Nothing
,则不会获得[]或“”等