我在cassandra中有一个表,我使用客户端TTL = 1个月保存数据(表TTL为0),表格配置了时间窗口压缩策略。
每天Cassandra都会清理一个包含过期数据的单个sstable。 最近我将客户TTL改为15天,我期待cassandra每天在某个时刻清理两个sstables,并释放空间。但它每天清理一次sstable并保留15天的死数据。
我怎么知道?
for f in /data/cassandra/data/keyspace/table-*/*Data.db; do meta=$(sudo sstablemetadata $f); echo -e "Max:" $(date --date=@$(echo "$meta" | grep Maximum\ time | cut -d" " -f3| cut -c 1-10) '+%m/%d/%Y') "Min:" $(date --date=@$(echo "$meta" | grep Minimum\ time | cut -d" " -f3| cut -c 1-10) '+%m/%d/%Y') $(echo "$meta" | grep droppable) ' \t ' $(ls -lh $f | awk '{print $5" "$6" "$7" "$8" "$9}'); done | sort
此命令列出所有sstables
Max: 05/19/2018 Min: 05/18/2018 Estimated droppable tombstones: 0.9876591095477787 84G May 21 02:59 /data/cassandra/data/pcc/data_history-c46a3220980211e7991e7d12377f9342/mc-218473-big-Data.db
Max: 05/20/2018 Min: 05/19/2018 Estimated droppable tombstones: 0.9875830312750179 84G May 22 15:25 /data/cassandra/data/pcc/data_history-c46a3220980211e7991e7d12377f9342/mc-221915-big-Data.db
Max: 05/21/2018 Min: 05/20/2018 Estimated droppable tombstones: 0.9876636061230402 85G May 23 13:56 /data/cassandra/data/pcc/data_history-c46a3220980211e7991e7d12377f9342/mc-224302-big-Data.db
...
现在我一直在使用JMX手动触发压缩,但是我想要像通常那样擦除所有压缩。
run -b org.apache.cassandra.db:type=CompactionManager forceUserDefinedCompaction /data/cassandra/data/keyspace/sstable_path
答案 0 :(得分:0)
我想我明白了。必须在最旧和最新的sstable上运行手动压缩,并且所有内容都已过期,两个sstable都在同一时间。 几天后,它清除了所有东西。
我怎么知道它正在运行?因为当我尝试在其间的任何其他sstable上运行forceUserDefinedCompaction时,它总是返回null。
编辑: 它没有用,再次稳定的数量不断增加。
编辑: 使用sstableexpiredblockers指向阻止其余压缩的sstables。手动压缩这些文件后,它将自动压缩其余文件。
在8个节点中的一个节点上,阻塞的sstable在压缩后并未解锁,因此“ nodetool scrub”完成了这项工作(将所有的sstables清理)。