Cassandra压缩分区的最大字节大小高于用于表的总空间

时间:2016-06-06 19:35:52

标签: datastax cassandra-2.0 datastax-enterprise

我正在使用Cassandra版本2.1.13.1218和cqlsh版本5.0.1。

对于给定的表,当我运行cfstats命令时,压缩分区的最大字节数大于使用的空间(总计)。例如: 压缩分区最大字节数:4.64 MB,使用空间(总计):2.28 MB。 表使用的总空间应该更高,因为所有大/小分区大小都是给定表的总空间的一部分。压缩分区的最大字节大小是如何高于表的总空间?

命令是:./cqlsh cfstats keyspace.columnfamilyname -H

有人可以帮助我理解这一点吗?空间使用(实时)和使用空间(总数)有什么不同?

1 个答案:

答案 0 :(得分:2)

使用的空间表示磁盘上的表使用了多少空间。这取决于OS和压缩比。 而Compacted partition max bytes只是max遇到的分区大小(压缩后)。这基于使用的数据建模/模式和逻辑记录大小。例如,100kb记录大小乘以40条记录(每条记录进入同一分区)将为您提供4MB分区。

当它位于磁盘上时可能会进一步压缩,您可能会在磁盘上获得2MB。你能分享剩下的统计数据吗(ex,min和avg大小的压缩信息,密钥数量)?