了解nodetool cfstats中的“键数”

时间:2015-01-15 12:53:57

标签: database-performance cql cassandra-2.0 nodetool

我是Cassandra的新手,在这个例子中,我使用的是一个具有1个DC和5个节点的集群,以及一个复制因子为3的NetworkTopologyStrategy。

   Keyspace: activityfeed
            Read Count: 0
            Read Latency: NaN ms.
            Write Count: 0
            Write Latency: NaN ms.
            Pending Tasks: 0
                    Table: feed_shubham
                    SSTable count: 1
                    Space used (live), bytes: 52620684
                    Space used (total), bytes: 52620684
                    SSTable Compression Ratio: 0.3727660543119897
                    Number of keys (estimate): 137984
                    Memtable cell count: 0
                    Memtable data size, bytes: 0
                    Memtable switch count: 0
                    Local read count: 0
                    Local read latency: 0.000 ms
                    Local write count: 0
                    Local write latency: 0.000 ms
                    Pending tasks: 0
                    Bloom filter false positives: 0
                    Bloom filter false ratio: 0.00000
                    Bloom filter space used, bytes: 174416
                    Compacted partition minimum bytes: 771
                    Compacted partition maximum bytes: 924
                    Compacted partition mean bytes: 924
                    Average live cells per slice (last five minutes): 0.0
                    Average tombstones per slice (last five minutes): 0.0

这里的键数是什么意思? 我的群集中有5个不同的节点,在分别在每个节点上触发下面的命令后,我得到同一个表的不同统计信息。

nodetool cfstats -h 192.168.1.12 activityfeed.feed_shubham

根据上面的输出,我可以解释cfstats给出了关于每个节点上数据的物理存储的统计数据。

我查看了下面的文档 http://www.datastax.com/documentation/cassandra/2.0/cassandra/tools/toolsCFstats.html 但我没有找到那里的钥匙数量的解释。

我正在使用RandomPartitioner。

此密钥与分区密钥有关吗?

我的桌子上有大约200000条记录。

2 个答案:

答案 0 :(得分:4)

键数表示该表的该节点上的分区键数。它只是一个估计,并根据您的C * its more accurate版本。在2.1.6之前,它总结了每个sstable在索引文件中列出的分区数。然后,它合并了每个sstable存储的数据草图(hyperloglog)。

答案 1 :(得分:3)

此值似乎表示所有本地sstables中的列/单元格总数。我想它应该被命名为“SSTable cell count”,就像相应的memtable值一样。但是,由于sstables在压缩之前存储冗余数据,因此该值不一定与作为结果集的一部分返回的实际列数相对应。