处理从序列化

时间:2015-05-21 16:13:26

标签: c++ serialization boost

我查看了网上关于通过增加版本号并在该变量的序列化周围添加“if”来向序列化函数添加成员变量的示例。

但是如果删除成员变量,我该怎么办?我应该从序列化函数中删除它并且boost会处理它吗?

如果我删除了序列化函数中“序列化”的一些类,这可能会变得更糟,我是否需要将它们保留为序列化代码或者还有其他方法?

1 个答案:

答案 0 :(得分:4)

背景/存档格式兼容性

在许多情况下,Boost Serialization非常轻量级。

具体来说,如果您不使用对象跟踪/动态多态,那么会产生令人惊讶的余地,使您的序列化流兼容。

跟踪和多态性在通过(智能)指针(到基础)进行序列化时成为一个因素。

标准库中的大多数东西,以及现代C ++中的大多数东西都支持值语义(例如所有标准容器),并且通过直接暗示,在这里发挥得很好。

  

作为一个具体的例子,我有很多成功序列化

std::map<std::string, boost::uuids::uuid>
     

进入二进制存档,并将此存档反序列化为

boost::unordered_map<std::string, boost::uuids::uuid>
// or
boost::flat_map<std::string, boost::uuids::uuid>
// or
std::vector<std::pair<std::string, boost::uuids::uuid> >

这些类型(需要)都不存储类型信息,因此二进制流兼容可交换。

也许如果你想 依赖 这种“偶然”兼容性,你可能想写广泛的测试

  

我有一种感觉,你应该能够设计一个trivial archive implementation,而不是序列化实际数据,创建所涉及的数据结构的“布局图”或“兼容性签名”。

     

这可以大大有助于验证不同类型之间的存档兼容性

案例研究1:改变了布局

这与原始问题非常匹配:“如果删除字段后如何对旧版本进行反序列化”。

这里的关键是: serialize只是一个函数。你可以做任何你需要的事情。参加一个经历两个版本的简单演示类:

struct MyType {
    MyType();
    MyType(std::string const& v);

  private:
    friend class boost::serialization::access;
    template <typename Ar> void serialize(Ar&, unsigned);

#if DEMO_VERSION == 0

    bool hasValue;
    std::string value;

#elif DEMO_VERSION == 1

    boost::optional<std::string> value;

#endif
};

显然,版本会有不同的实现。

诀窍是反序列化为临时变量,然后根据业务规则在新语义上映射旧语义:

#if DEMO_VERSION == 0
MyType::MyType()                     : hasValue(false)          {}
MyType::MyType(std::string const &v) : hasValue(true), value(v) {}

template <typename Ar> void MyType::serialize(Ar& ar, unsigned /*file_version*/) {
    ar & hasValue & value; // life was simple in v0
}

#elif DEMO_VERSION == 1
MyType::MyType()                     : value(boost::none)       {}
MyType::MyType(std::string const &v) : value(v)                 {}

template <typename Ar> void MyType::serialize(Ar& ar, unsigned file_version) {
    switch (file_version) {
        case 0: {
            assert(Ar::is_loading::value); // should not be writing old formats
            //
            bool        old_hasValue;      // these fields no longer exist
            std::string oldValue;

            ar & old_hasValue & oldValue;

            // translate to new object semantics/layout
            value.reset();
            if (old_hasValue) value.reset(oldValue);

            break;
        }
        default: // v1+
            ar & value;
    }
}
#endif

您可以在Coliru上看到此过程,其中程序v0将对象写入v0.dat,程序v1成功读取(并以新格式序列化):

<强> Live On Coliru

BOOST_CLASS_VERSION(MyType, DEMO_VERSION)
#include <fstream>

namespace demo {
    template <typename T> void serialize(std::ostream& os, T const& obj) {
        {
            boost::archive::text_oarchive oa(os);
            oa << obj;
        }
        os.flush();
    }

    template <typename T> void save(std::string const& fname, T const& payload) {
        std::ofstream ofs(fname, std::ios::binary);
        serialize(ofs, payload);
    }

    MyType load(std::string const& fname) {
        std::ifstream ifs(fname, std::ios::binary);

        MyType obj;

        boost::archive::text_iarchive ia(ifs);
        ia >> obj;

        return obj;
    }
}

int main(int, char** cmd) {
    std::cout << "Running " << *cmd << " with DEMO_VERSION=" << DEMO_VERSION << "\n";
    using namespace demo;

#if DEMO_VERSION == 0

    MyType payload("Forty two");
    save     ("v0.dat", payload);  // uses v0 format
    serialize(std::cout, payload); // uses v0 format

#elif DEMO_VERSION == 1

    auto loaded = load("v0.dat");  // still reads the v0 format
    serialize(std::cout, loaded);  // uses v1 format now

#endif
}

打印:

for v in 0 1
do
    g++ -std=c++11 -Os -Wall -DDEMO_VERSION=$v main.cpp -o v$v -lboost_system -lboost_serialization
    ./v$v
done
Running ./v0 with DEMO_VERSION=0
22 serialization::archive 11 0 0 1 9 Forty two
Running ./v1 with DEMO_VERSION=1
22 serialization::archive 11 0 1 0 0 1 0 9 Forty two

案例研究2:更改/删除类型

就像你说的那样,最简单的做法可能是保留旧类型以进行间接反序列化。

参考上面的“背景/存档格式兼容性”部分,只要您知道自己在做什么,就会有另一种选择。

我们假设上面的示例(“案例研究1”)略有不同,并使用PoorMansOptional<std::string>取代了boost::optional<std::string>。您可以找出反序列化的等效字段。

  

记下可能散布的额外项目版本字段。在上述容器实例中的项目之间不方便地存在这样的字段。