XML Unicode安全编码

时间:2010-11-25 16:54:43

标签: c# xml unicode encoding

我正在寻找一种使用#& 233编码XML文档的方法;编码

使用此基本代码

var xmlDoc = new XmlDocument();
xmlDoc.Load(@"D:\Temp\XmlDocBase.xml");
xmlDoc.Save(@"D:\Temp\XmlDocBaseCopy.xml");

我的Xml文档来自:

<?xml version="1.0"?>
<Tag1>
  <comment>entit&#233;</comment>
</Tag1>

<?xml version="1.0"?>
<Tag1>
  <comment>entité</comment>
</Tag1>

此致

2 个答案:

答案 0 :(得分:5)

您可以强制不支持所有unicode字符(即ASCII)的编码。结果编者将被迫使用实体。

    XmlDocument doc = new XmlDocument();
    doc.LoadXml("<Tag1><comment>entit&#233;</comment></Tag1>");

    var writer = XmlTextWriter.Create(
        @"c:\temp\o.xml",
        new XmlWriterSettings { Encoding = System.Text.ASCIIEncoding.ASCII });
    doc.Save(writer);

结果:

<?xml version="1.0" encoding="us-ascii"?><Tag1><comment>entit&#xE9;</comment></Tag1>

答案 1 :(得分:2)

您可以在字符串上调用HttpUtility.HtmlEncode。

return HttpUtility.HtmlEncode("entité");

返回entit&#233;

HttpUtility是System.Web的一部分。