我处理过的大多数文档仅包含几种类型的对象。例如,来自服务器的推文列表可能仅包含三种对象类型:推文,评论和用户。可能看起来像这样:
{
"tweets": [
{
"content": ...,
"retweet_count": ...,
"user": {
"name": ...,
}
"comments": [
{
"content": ...,
"user": ...,
}, ...
]
}, ...
]
}
字典键会不断重复,这会浪费空间(即使压缩后)和解析时间。是否有任何流行的无模式序列化格式可以某种方式消除这种重复,例如指向文档中以前的字典键?