我需要为每个条目存储带时间戳的车辆位置以及反向地理编码地址和一些简单的数字传感器值。
如果我存储反向地理编码器返回的替代地址和其他元数据,则反向地理编码地址在100到200字节之间,大约为4kb。大多数情况下,地址在连续记录中不会改变。我想知道Cassandra是否有可能压缩这种不经常变化的值。同样,其他传感器值,如温度,压力等也不会经常改变。
几年前我曾尝试过使用InfoBright的MySQL专栏库引擎。它的一个主张是它很好地压缩了不经常改变的领域。
这样的事情可以用Cassandra完成吗?我读了一些让我想到的文章。如果是这种情况,它是一个杀手级的功能,因为大多数涉及传感器的时间序列数据都有很多行程长度压缩的范围。但是在我遇到的文章中对这个主题的普遍缺乏兴奋使我觉得实际上的好处并不多。或者他们根本就没有像我这样长时间重复数据的数据。报告的压缩比约为4倍。基于简单的RLE,我期待至少10倍。但由于Cassandra比RLE有更好的算法,我希望能达到更高的压缩率。
我正在阅读有关Cassandra的所有内容,并将尽快进行这些测试。但如果有人可以分享他们的两分钱,那就太好了。