应用错误收集

Boost和Cereal在Cap＆＃Proto或Flatbuffers的意义上不实现零拷贝。

使用真正的零拷贝序列化，实时内存中对象的后备存储实际上与传递给read()或write()系统调用的内存段完全相同。根本没有包装/拆包步骤。

一般来说，这有很多含义：

不使用new / delete分配对象。构造消息时，首先分配消息，为消息内容分配一个长的连续内存空间。然后，您可以直接在消息中分配消息结构，接收指向事实上指向消息内存的指针。稍后写入消息时，单个write()调用会将整个内存空间推到线路上。

同样，当您阅读消息时，单个read()调用（或可能是2-3）将整个消息读入一个内存块。然后你得到一个指针（或类似指针的对象）到＆＃34; root＆＃34;消息，您可以用它来遍历它。请注意，在应用程序遍历之前，实际上不会检查消息的任何部分。

使用普通套接字时，您的数据的唯一副本将发生在内核空间中。使用RDMA网络，您甚至可以避免内核空间副本：数据从线路直接进入其最终内存位置。

使用文件（而不是网络）时，可以直接从磁盘mmap()发送一个非常大的消息，并直接使用映射的内存区域。这样做是O（1） - 文件的大小并不重要。当您实际访问文件时，您的操作系统将自动在文件的必要部分进行分页。

同一台计算机上的两个进程可以通过共享内存段进行通信而无需副本。请注意，通常，常规的旧C ++对象在共享内存中不能很好地工作，因为内存段通常在两个内存空间中都没有相同的地址，因此所有指针都是错误的。使用零拷贝序列化框架时，指针通常表示为偏移而不是绝对地址，因此它们与位置无关。

Boost和Cereal是不同的：当你在这些系统中收到一条消息时，首先要对整个消息执行一次传递，然后解压缩＆＃34;解压缩＆＃34;内容。数据的最终静止位置是使用new / delete以传统方式分配的对象。类似地，当发送消息时，必须从该对象树收集数据并将其打包在一起形成一个缓冲区以便写出。尽管Boost和Cereal是可扩展的，但真正的零拷贝需要一个非常不同的底层设计;它不能作为扩展名用螺栓固定。

尽管如此，不要假设零拷贝总是会更快。 memcpy()可能非常快，而你的其他程序可能会使成本相形见绌。同时，零拷贝系统往往具有不方便的API，特别是因为内存分配的限制。总的来说，可以更好地利用您的时间来使用传统的序列化系统。

零拷贝最明显有利的地方是操作文件时，因为正如我所提到的，你可以很容易地mmap()一个巨大的文件，只读取它的一部分。非零复制格式根本无法做到这一点。然而，在网络方面，优势不太明显，因为网络通信本身必然是O（n）。

在一天结束时，如果您真的想知道哪个序列化系统最适合您的用例，您可能需要全部尝试并测量它们。请注意，玩具基准通常具有误导性;你需要测试你的实际用例（或类似的东西）以获得有用的信息。

披露：我是Cap＆＃cu; n Proto（零拷贝序列化器）和Protocol Buffers v2（一种流行的非零拷贝序列化器）的作者。

Boost Serialization是可扩展的。

它允许您的类型描述需要序列化的内容，以及描述格式的档案。

这可以是“零拷贝” - 即唯一的缓冲是在接收数据的流中（例如套接字或文件描述符）。

有关dynamic_bitset序列化的有意识零拷贝实现的示例，请参阅此答案中的代码：How to serialize boost::dynamic_bitset?

我在网站上有很多这些。另请参阅BOOST_IS_BITWISE_SERIALIZABLE的文档及其对容器序列化的影响（如果序列化连续分配的按位序列化数据集合，则结果为零拷贝甚至__memcpy_sse4等）

旁注：Cap'n proto完全做了其他事情，AFAIK：它将一些对象作为期货到数据进行整理。这显然是他们积极宣传“∞％更快，0μs!!!” （在从未检索过数据的情况下，这有点真实。）

谷物和Boost序列化是否使用零拷贝？

2 个答案: