C ++:如何在不使用库的情况下序列化/反序列化对象?

时间:2012-07-10 14:43:37

标签: c++ serialization deserialization

我试图了解序列化/反序列化如何在不使用库的情况下在C ++中工作。我从简单的对象开始,但是当反序列化向量时,我发现,如果没有先写入它的大小,我就无法获得向量。而且,我不知道应该选择哪种文件格式,因为如果在向量大小之前存在数字,我就无法正确读取它。此外,我想用类和映射容器来做到这一点。我的任务是序列化/反序列化这样的对象:

PersonInfo
{
    unsigned int    age_;
    string name_;
    enum { undef, man, woman } sex_;
}

Person : PersonInfo 
{
    vector<Person>      children_;
    map<string, PersonInfo>     addrBook_;
}

目前我知道如何序列化这样的简单对象:

vector<PersonInfo> vecPersonInfo;
vecPersonInfo.push_back(*personInfo);
vecPersonInfo.push_back(*oneMorePersonInfo);

ofstream file("file", ios::out | ios::binary);
if (!file) {
    cout<<"can not open file";
} else {
    vector<PersonInfo>::const_iterator iterator = vecPersonInfo.begin();
    for (; iterator != vecPersonInfo.end(); iterator++) {
        file<<*iterator;
    }

请您建议,我如何为这个复杂的对象或一个能够清楚解释它的好教程做到这一点?

2 个答案:

答案 0 :(得分:12)

一种模式是实现一个抽象类,定义序列化的函数,类定义了串行器的内容以及出现的内容。一个例子是:

class Serializable
{
public:
    Serializable(){}
    virtual ~Serializable(){}

    virtual void serialize(std::ostream& stream) = 0;
    virtual void deserialize(std::istream& stream) = 0;
};

然后为要序列化的类/结构实现Serializable接口:

struct PersonInfo : public Serializable // Yes! It's possible
{
    unsigned int age_;
    string name_;
    enum { undef, man, woman } sex_;

    virtual void serialize(std::ostream& stream)
    {
        // Serialization code
        stream << age_ << name_ << sex_;
    }

    virtual void deserialize(std::istream& stream)
    {
        // Deserialization code
        stream >> age_ >> name_ >> sex_;
    }
};

休息我相信你知道。这里有几个障碍可以通过你的闲暇来完成:

  1. 当你将一个字符串写入包含空格的流并尝试将其读回时,你将只得到它的一部分而其余的字符串'会破坏'之后读取的值。
  2. 如何编程以使其跨平台(小端与大端)
  3. 您的程序如何自动检测反序列化时要创建的类。
  4. 线索:

    1. 使用具有写bool,int,float,strings等函数的自定义序列化程序
    2. 使用字符串表示要序列化的对象类型,并在反序列化时使用factory创建该对象的实例。
    3. 使用预定义的宏来确定正在编译代码的平台。
    4. 始终以固定的endian文件写入文件,并使用其他endianess的平台进行调整。

答案 1 :(得分:1)

最基本的形式是定义一个定义虚拟读/写方法的“Serialisable”接口(抽象类)。您还定义了一个“Stream”接口,它为基本原语类型提供了一个通用API(例如读取/写入整数,浮点数,字节,字符,查找/复位),也可能用于某些复合类型(值的数组,例如字符串,向量)等)在流上运行。如果适合您,可以使用C ++ IOStream。

您还需要为工厂设置一些id系统,以便在加载/反序列化时创建相应的类,并在序列化复杂类型时进行引用,以便每个逻辑部分都标记/标题化时具有适当的结构/长度信息必要的。

然后,您可以为每种媒体创建具体的Stream类(如文本文件,二进制文件,内存,网络等)。

您希望可序列化的每个类都必须继承Serializable接口并实现细节(如果是复合类/复杂类,则递归利用为其他类型定义的可序列化接口)。

这当然是一种添加序列化的天真和“侵入式”方式(必须修改参与类)。然后,您可以使用模板或预处理器技巧来减少干扰。请参阅Boost或协议缓冲区或任何其他库,以获取有关代码在代码中的外观的想法。

你真的确定要自己动手吗?它可能变得非常混乱,特别是当你有指针,对象之间的指针(包括循环)时,你还需要在加载/反序列化对当前运行正确之前的某个时刻进行修复/转换。