澄清cassandra文档

时间:2016-04-16 21:16:31

标签: cassandra

在我们阅读的documentation about indexes

  

在这些情况下不要使用索引:

     
      
  • 在高基数列上,因为您随后会查询大量记录以获取少量结果。请参阅使用a的问题   下面的高基数列索引。
  •   

什么是高基数,更精确的术语100,1000,更多?

1 个答案:

答案 0 :(得分:2)

这是一个依赖问题,但我可以给你一些指导。二级索引是为了方便而不是速度。查找列值可能是您需要在查询中支持的内容,这将为您提供。接下来的问题是你能忍受多慢?如果您有一个小型集群和数百万个数据分区,那么低数字不会产生太大的影响。

如果考虑每行计数的唯一值比率,您希望速度接近一对一。