如何在C *(Cassandra)中执行高效的SELECT *查询

时间:2016-02-16 12:43:12

标签: database performance architecture apache-spark cassandra

表中有大量数据,SELECT *查询似乎效率低下。 怎么可能解决这个问题?

对于C *基础设施的设计或表本身的设计有什么想法吗?

可能有任何特殊的查询结构可以更有效地选择所有元素吗?

1 个答案:

答案 0 :(得分:10)

  

表中有大量数据,SELECT *查询似乎效率低下。怎么可能解决这个问题?

使用关系数据库,SELECT * FROM无限制== 全表扫描

使用分布式数据库,例如 Cassandra ,SELECT * FROM无限制== 完整CLUSTER扫描,可能在100多台机器的群集上....

长话短说,全桌扫描未设计

如果您需要扫描表格中的所有数据,请使用 Apache Spark Spark / Cassandra 连接器来完成工作。

  

可能有任何特殊的查询结构可以更有效地选择所有元素吗?

不,魔法不存在。如果有人能够非常快速地找到在分布式数据库中执行全表扫描的方法,那么他已经是百万富翁。