Cassandra CQL时间范围查询

时间:2013-01-18 20:55:12

标签: nosql cassandra bigdata cql

我有一个Cassandra列系列,我每月存储大量(数十万)个事件,时间戳(“Ymdhisu”)作为行键。它有多列为每个事件捕获一些数据。我尝试检索特定时间范围的事件数据。例如,对于Jan,我使用了以下CQL查询:

a)2013年1月1日至1月15日范围内的查询

  

从Test中选择count(*),其中Key> 20130101070100000000和密钥<   20130115070100000000限制100000;错误请求:启动密钥的md5排序   在结束键的md5之后。这是不允许的;你可能不应该   在RandomPartitioner

下完全指定结束键

b)2013年1月1日至1月10日范围内的查询

  

从Test中选择count(*),其中Key> 20130101070100000000和密钥<   20130110070100000000限制100000;伯爵 - 73264

c)2013年1月1日至1月2日范围内的查询

  

从Test中选择count(*),其中Key> 20130101070100000000和密钥<   20130102070100000000限制100000;伯爵 - 78328

似乎范围搜索根本不起作用!我的Columnfamily的架构是:

Create column family Test with comparator=UTF8Type and default_validation_class=UTF8Type and key_validation_class=UTF8Type AND compression_options={sstable_compression:SnappyCompressor, chunk_length_kb:64};

要提取数据,有什么建议?我是否需要使用密钥验证类重新定义我的模式作为TimeUUID类型?有没有其他方法可以有效地查询而不更改架构? 我在这个专栏系列中每月处理至少100-200K行的数据。如果此模式不能用于此目的,那么存储和检索此处描述的数据类型的Cassandra模式是什么?

1 个答案:

答案 0 :(得分:5)

您可以创建二级索引,例如“日期”和“月”,并将每个事件的日期和月份与其他数据一起存储在这些列中。查询数据时,您可以获取指定月份或日期的所有行。

我不认为Keys上的范围查询会起作用。也许你将分区器从RandomPartitioner更改为ByteOrderedPartitioner?