我有一些商业对象来存储客户名称,有时名称包含一些特殊字符,如
,
。这些名称是从第三方导入的,我无法从源代码中删除有趣的字符。
应用程序将通过XmlSerializer序列化/反序列化客户对象,但奇怪的是,当我使用特殊字符序列化名称时,没有错误,结果将类似于此<Name>Jim <Name>
。但是当我反序列化输出xml时,我将得到异常There is an error in XML document (3, 15)
。
那么如何在我的应用程序中处理这些特殊字符?谢谢!
附上一些测试代码:
public class Customer
{
public string Name;
}
class Program
{
public static T DeserializeFromXml<T>(string settings) where T : class
{
var serializer = new XmlSerializer(typeof(T));
var reader = new StringReader(settings);
var result = serializer.Deserialize(reader);
return result as T;
}
public static string SerializeToXml<T>(T settings)
{
var serializer = new XmlSerializer(typeof(T));
var writer = new StringWriter();
serializer.Serialize(writer, settings);
return writer.ToString();
}
static void Main(string[] args)
{
var str = new char[] { 'J', 'i', 'm', (char)2 };
var customer = new Customer { Name = new string(str) };
var output = SerializeToXml(customer);
var obj = DeserializeFromXml<Customer>(output);
}
}
答案 0 :(得分:3)
我的问题没有解决方案,但这里是背景信息。
字符串&amp;#2;是用于表示值为'2'的字符的XML。根据XML 1.0,这不是一个有效的字符。请参阅http://www.w3.org/TR/2004/REC-xml-20040204/#NT-Char。
.Net CLR是一致的。 Xml序列化程序将很乐意生成具有非法字符的XML文档。但是,当遇到非法字符时,反序列化器将抛出。
有关详细信息,请参阅http://msdn.microsoft.com/en-us/library/aa302290.aspx。
XML 1.1放宽了限制。但.Net仅支持XML 1.0。