我希望看看GridGain缓存的数据存储效率如何。即。如果我将1TB的数据加载到缓存中,它需要1TB的空间吗?大多数数据都是重复的,某些字段是相同的,即。例如,Browser =“Chrome”,所以我希望看看GridGain如何利用这种重复
我环顾四周并找到了http://gridgain.com/columnar-vs-key-value-storage-models/,但它本身并没有给出可靠的统计数据,但确实预示着短暂的到来,因为它注意到“缺乏”压缩 - 但我想看看这是否意味着= x TB的RAM中的x TB数据消失了,我想了解我如何自己查看(可能通过ggvisor?)
目标:查看群集,看看我有可用内存的Y GB。通过GridDataLoader将X单位的数据加载到缓存中。查看群集,看看我有可用内存的GB。因此压缩可以通过X:(Y - Y')
计算由于
答案 0 :(得分:0)
GridGain没有数据压缩,但如果使用Externalizable
对象,基本类型或字符串,格式将相当紧凑。您还可以尝试在客户端使用任何类型的压缩,并将压缩的字节数组存储在缓存中。
另外,尝试设置GridCacheConfiguration.setStoreValueBytes(false)
并查看是否可以节省空间。