我经常读到BinaryFormatter比XmlSerializer具有更好的性能。 出于好奇,我写了一个测试应用程序。
一个wtf时刻......为什么Xml比Bin快得多(特别是反序列化)?
using System;
using System.Collections.Generic;
using System.Runtime.Serialization;
using System.Xml.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using System.IO;
namespace SerPlayground
{
class Program
{
static void Main(string[] args)
{
var items = new List<TestClass>();
for (int i = 0; i < 1E6; i++)
{
items.Add(new TestClass() { Name = i.ToString(), Id = i });
}
File.Delete("test.bin");
using (var target = new FileStream("test.bin", FileMode.OpenOrCreate))
{
System.Threading.Thread.Sleep(1000);
var bin = new BinaryFormatter();
var start = DateTime.Now;
bin.Serialize(target, items);
Console.WriteLine("Bin: {0}", (DateTime.Now - start).TotalMilliseconds);
target.Position = 0;
System.Threading.Thread.Sleep(1000);
start = DateTime.Now;
bin.Deserialize(target);
Console.WriteLine("Bin-D: {0}", (DateTime.Now - start).TotalMilliseconds);
}
File.Delete("test.xml");
using (var target = new FileStream("test.xml", FileMode.OpenOrCreate))
{
System.Threading.Thread.Sleep(1000);
var xml = new XmlSerializer(typeof(List<TestClass>));
var start = DateTime.Now;
xml.Serialize(target, items);
Console.WriteLine("Xml: {0}", (DateTime.Now - start).TotalMilliseconds);
target.Position = 0;
System.Threading.Thread.Sleep(1000);
start = DateTime.Now;
xml.Deserialize(target);
Console.WriteLine("Xml-D: {0}", (DateTime.Now - start).TotalMilliseconds);
}
Console.ReadKey();
}
}
[Serializable]
public class TestClass
{
public string Name { get; set; }
public int Id { get; set; }
}
}
我的结果:
Bin: 13472.7706
Bin-D: 121131.9284
Xml: 8917.51
Xml-D: 12841.7345
答案 0 :(得分:7)
因为您正在序列化一个没有任何属性的对象。
如果序列化实际包含某些数据的不同内容(例如字符串),则二进制序列化器比XML序列化器快得多。
我对您的代码进行了此更改:
items.Add("asfd");
我得到了这个结果:
Xml: 1219.0541
Bin: 165.0002
差异的一部分当然是XML文件大约是二进制文件的十倍。
答案 1 :(得分:3)
这个例子非常好,问题很有意思(我同意Robert的观点,你应该在进行任何测量之前至少运行一次Main方法,因为variuos排序的初始化不应该被认为是测试的一部分。)< / p>
话虽如此,XmlSerializer和BinaryFormatter之间的一个关键区别(除了显而易见的)是XmlSerializer没有尝试跟踪引用。如果对象图具有对同一对象的多个引用,则会在XML中获得多个副本,并且在反序列化时无法正确解析(返回单个对象)。更糟糕的是,如果你有循环,则根本无法对序列进行序列化。将其与BinaryFormatter进行对比,BinaryFormatter可以跟踪引用并可靠地重建对象图,无论您有多少,以及您可能具有哪种对象引用。也许这个设施的开销会导致较差的表现?
在XmlSerializer上使用BinaryFormatter的主要原因是输出的 size ,而不是serialziation / deserialization的性能。 (构建文本的开销不是很大,而是传输那些昂贵的xml文本。)
答案 2 :(得分:1)