标签: cassandra
这是我的情况:我有一个csv流,它表示每天1-2百万个事件,必须根据两个变量进行过滤:日期范围和四个不同列之一。我唯一的限制是数据必须存储在单个服务器上。
我是数据库的高级用户,在Postgres和Mysql上我得到了一些有趣的结果,每天都有分区,四列都有索引。我对Cassandra进行了一些尝试,但对性能却感到非常失望。与数据库相比,Cassandra可以在单个服务器上进行这种筛选吗?我尝试了不同的表结构,但没有明显的性能结果。你有什么建议吗?