我们正在探索SPARK for cassandra,以克服CQL的局限性。
我们最初仅限于CQL,但在RDBMS方面遇到的障碍/障碍很少。仅举几例如下
我是cassandra的新手,由于局限性,我最终会重新审视我的架构。
因此与HDFS的HIVE / PIG类似,Spark对CQL有哪些额外的好处?
答案 0 :(得分:2)
CQL不是SQL的替代品。它实际上是为从几个(通常是一个)分区键中提取值而设计的,正如您所指出的,它不会进行任何类型的聚合,分组,非常有限的排序等(尽管Cassandra 3.0将具有UDF和UDA)
以下是Spark提供的优于CQL的内容:
Spark与CQL完全不同。它提供了对大量数据的复杂分析,CQL没有。但是,也有一些限制:
如果您希望通过Cassandra进行非常快速的分析查询并支持更新而不需要缓存,那么请查看我的项目http://github.com/tuplejump/FiloDB。