我正在阅读文章以了解有关datacontractserializer和binaryformatter序列化程序的更多信息。根据到目前为止所做的阅读,我的印象是binaryformatter应该比datacontractserializer的占用空间小。原因是DataContractSerializer序列化为xml信息集,而binaryformatter序列化为专有二进制格式。
以下是测试
[Serializable]
[DataContract]
public class Packet
{
[DataMember]
public DataSet Data { get; set; }
[DataMember]
public string Name { get; set; }
[DataMember]
public string Description { get; set; }
}
DataSet中填充了121317
表
[AdventureWorks].[Sales].[SalesOrderDetail]
行
using (var fs = new FileStream("test1.txt", FileMode.Create))
{
var dcs = new DataContractSerializer(typeof(Packet));
dcs.WriteObject(fs, packet);
Console.WriteLine("Total bytes with dcs = " + fs.Length);
}
using(var fs = new FileStream("test2.txt", FileMode.Create))
{
var bf = new BinaryFormatter();
bf.Serialize(fs, packet);
Console.WriteLine("Total bytes with binaryformatter = " + fs.Length);
}
Results
Total bytes with dcs = 57133023
Total bytes with binaryformatter = 57133984
问题 为什么binaryformatter的字节数超过datacontractserializer?不应该小得多吗?
答案 0 :(得分:5)
DataSet
有一个坏习惯:它实现ISerializable
,然后默认将其内容序列化为XML字符串,即使传递给BinaryFormatter
也是如此。这就是两个流的大小几乎相同的原因。如果将其RemotingFormat
属性更改为Binary
,它将执行相同的操作,但是创建一个新的BinaryFormatter
,将自身转储到MemoryStream
,然后放置生成的字节数组作为外部BinaryFormatter
的流中的值。
除此之外,BinaryFormatter
提供了有关类型的更多信息,例如它们来自的程序集的全名;此外,对于DataSet
,XML还有每个对象的开销。
如果您正在尝试比较两个序列化程序的行为,DataSet
是一个糟糕的选择,因为它会覆盖太多。