我正在编写一个使用Google Protocol Buffers来序列化数据的C ++应用程序。一切正常,但我担心我会过度复杂化某些东西。
现在我有一条名为REPORT的GPB消息,其中有一个名为RECORD的重复消息字段。我有一个名为RecordManager的C ++类,其对象负责管理REPORT中的各个RECORD。这些RecordManagers保存在std :: vector中。我会定期迭代它们并告诉它们更新它们相关的RECORD对象。然后我将整个REPORT序列化为一个文件并继续。
我的问题是我将RecordManager与RECORD关联起来的方式。现在,当我需要一个新记录时,我在重复字段中添加一个新的RECORD,并在向量上构造一个新的RecordManager,其中包含新RECORD的索引。每次RecordManager更新其RECORD时,它都会使用存储的索引在重复的字段上定位它,然后执行其工作。如果我想删除一条记录,我必须从向量中删除RecordManager,将RECORDs字段上的最后一项与我删除的项目交换,将RECORDs字段向下修剪一,然后更新RecordManager带有新索引的交换字段。它不是很漂亮。
我想要做的是让每个RecordManager在重复的字段上只保持一个指向RECORD的指针,这会使事情变得更加清晰。我无法找到的(以及我之所以这样做的原因)是GPB文档中的任何地方保证这些指针在分配/解除分配后仍然有效。运行一些简单的测试并快速查看底层的RepeatedPtrField代码,我似乎很安全,但我不想仅仅依赖于未记录的实现。是否有人熟悉C ++ GPB库,让我知道我是否安全?
我现在正在使用GPB 2,但希望它能够面向未来,如果这有所作为的话。
谢谢!
编辑:添加了一些我用来测试的代码:
首先是消息:
// test_message.proto
message RECORD{
required int32 val = 1;
}
message REPORT{
repeated RECORD record = 1;
}
来源:
// main.cpp
#include <iostream>
#include <vector>
#include "test_message.pb.h"
struct RecordManager{
RECORD *my_record;
RecordManager(RECORD * rec):my_record(rec){
my_record->set_val(0);
};
void update(){
my_record->set_val(my_record->val() + 1);
}
};
int main (int argc, char ** argv){
REPORT big_report;
std::vector<RecordManager> managers;
// Test using pointers while adding
for (size_t i = 0; i < 10; i++){
managers.push_back(RecordManager(big_report.add_record()));
for (RecordManager manager : managers){
manager.update();
}
}
std::cout << big_report.DebugString() << std::endl;
// Test using pointers after deleting from middle of repeated field
big_report.mutable_record()->DeleteSubrange(5,1);
managers.erase(managers.begin() + 5);
for (RecordManager manager : managers){
manager.update();
}
std::cout << big_report.DebugString() << std::endl;
return 0;
}
答案 0 :(得分:1)
我是proto2的作者,我会说你很安全。 RepeatedPtrField
类是一个公共界面,很多代码,特别是在Google内部,很大程度上取决于它的内部工作原理。实际上有些代码会在消息之间混合子对象以避免分配;如果类不是指针数组,那么它就不会真正起作用,只要它是一个指针数组,使用任何在修改时使子指针指针无效的实现都是愚蠢的。
那就是说,我不再处理protobufs,所以我不能亲自代表团队未来可能做的事情。