如何处理特殊字符?什么时候序列化/反序列化xml对象?

时间:2013-06-28 04:49:15

标签: c# .net xml serialization

我有一些商业对象来存储客户名称,有时名称包含一些特殊字符,如。这些名称是从第三方导入的,我无法从源代码中删除有趣的字符。

应用程序将通过XmlSerializer序列化/反序列化客户对象,但奇怪的是,当我使用特殊字符序列化名称时,没有错误,结果将类似于此<Name>Jim &#2;<Name>。但是当我反序列化输出xml时,我将得到异常There is an error in XML document (3, 15)

那么如何在我的应用程序中处理这些特殊字符?谢谢!

附上一些测试代码:

    public class Customer
    {
        public string Name;
    }

    class Program
    {
        public static T DeserializeFromXml<T>(string settings) where T : class
        {
            var serializer = new XmlSerializer(typeof(T));
            var reader = new StringReader(settings);
            var result = serializer.Deserialize(reader);
            return result as T;
        }

        public static string SerializeToXml<T>(T settings)
        {
            var serializer = new XmlSerializer(typeof(T));
            var writer = new StringWriter();
            serializer.Serialize(writer, settings);
            return writer.ToString();
        }

        static void Main(string[] args)
        {
            var str = new char[] { 'J', 'i', 'm', (char)2 };
            var customer = new Customer { Name = new string(str) };

            var output = SerializeToXml(customer);

            var obj = DeserializeFromXml<Customer>(output);
        }
    }

1 个答案:

答案 0 :(得分:3)

我的问题没有解决方案,但这里是背景信息。

字符串&amp;#2;是用于表示值为'2'的字符的XML。根据XML 1.0,这不是一个有效的字符。请参阅http://www.w3.org/TR/2004/REC-xml-20040204/#NT-Char

.Net CLR是一致的。 Xml序列化程序将很乐意生成具有非法字符的XML文档。但是,当遇到非法字符时,反序列化器将抛出。

有关详细信息,请参阅http://msdn.microsoft.com/en-us/library/aa302290.aspx

XML 1.1放宽了限制。但.Net仅支持XML 1.0。