简介
我正在尝试从Cassandra 1.2.6群集中收集一些统计信息来实现Web服务,以便将这些统计信息提供给Web应用程序。我正在使用cql库从Python访问集群,但我也可以ssh或pssh到节点。
问题
我的问题是如何获得整个群集中的总表大小(即每个表的实际磁盘使用量),如果可能的话,每个表的总行数(这可以是估计值)。
问题
到目前为止,我发现的唯一选项似乎是在每个节点上运行nodetool cfstats并解析响应,有没有更好的方法呢?
提前致谢!
答案 0 :(得分:1)
我认为最好的方法是直接通过JMX访问统计信息(这是nodetool实际工作的方式。)每个节点都提供了广泛的指标,但你会感兴趣的是。
org.apache.cassandra.metrics
ColumnFamily
cf_name
TotalDiskSpaceUsed
MemtableDataSize