我真的不了解差分缓冲区的原理。 主要原因是避免将新元组插入主存储器,因为需要重新组织字典和属性向量。但是如果我们在差异缓冲区中插入新值,我们仍然需要重新组织它的字典和属性值。差分缓冲区应以何种方式改善性能?
答案 0 :(得分:1)
使用差异缓冲区,您不会更改主存储中的任何压缩数据。相反,您只需将有效标志设置为0(false)即可识别过时的数据集。在差分缓冲区本身中,数据在未排序的字典中压缩。因此,您可以轻松插入新数据,因为无需重新组织字典或属性向量。未排序字典的缺点:范围选择更昂贵。
缓冲区具有最大大小,因此您必须定期将其与主存储区合并。
有关详细信息,请查看https://www.fbi.h-da.de/fileadmin/personal/u.stoerl/BigData-SoSe16/BigData-SoSe16-4-InMemory.pdf第27至39页。