通过压缩和修复从Cassandra db中大量删除数据后,磁盘空间未发生变化

时间:2016-10-26 20:25:42

标签: cassandra diskspace repair nodetool

我们有一个带有15个节点的Cassandra集群(2.1.11),SSD驱动器上的复制因子3。

其中一张桌子占12 TB。实时磁盘空间和总磁盘空间都是等效的。我还验证了这个数字在Ops中心,JMX报告和文件系统上的实际文件夹大小上是相同的。

我们的空间不足,所以我们已经删除了35%的整个数据。 (每个条目有104个字节,所以我们删除了数十亿行)

但是,我们根本没有获得任何可用空间,尽管我们在删除条目时会看到很多压缩。

从那时起,我们运行了nodetool repair / nodetool clean / restart进程jvm,没有运气。

有人知道我能做的其他事情吗?

1 个答案:

答案 0 :(得分:3)

假设在删除的数据有资格最终删除生成的墓碑之前,您必须等待gc_grace_seconds。所以在适当的时候提前计划:)

这是了解Cassandra内部工作和删除磁盘空间释放的good link。也许可以考虑这个link以及如何进行用户定义的压缩。