Cassandra列名称排序

时间:2015-01-28 04:58:49

标签: sorting cassandra

我已经读过Cassandra列的物理排序。如果节点中只有一行密钥(在单个SSTable中),我觉得这是正确的。如果具有不同/相同列的多个SSTable中存在相同的键,则节点本身必须在从每个SSTable读取之后对其进行排序。如果这是正确的,那么用于按目的进行列排序/排序的Cassandra的宽行概念将如何变得高效。

1 个答案:

答案 0 :(得分:1)

你说得对,Cassandra根据Clustering Columns保存在磁盘上排序的行。这减少了磁盘上的搜索以满足查询。

分区可以存在于磁盘上的多个SSTable中也是正确的,每个SSTable将在磁盘上排序,但是当节点读取分区时,它会合并内存中每个sstaqble的值+ memtable中该分区的任何值

压缩旨在最大限度地减少存在的SSTable数量,以保持磁盘搜索次数的减少。磁盘可能比合并排序数据慢。