在我们阅读的documentation about indexes
在这些情况下不要使用索引:
- 在高基数列上,因为您随后会查询大量记录以获取少量结果。请参阅使用a的问题 下面的高基数列索引。
什么是高基数,更精确的术语100,1000,更多?
答案 0 :(得分:2)
这是一个依赖问题,但我可以给你一些指导。二级索引是为了方便而不是速度。查找列值可能是您需要在查询中支持的内容,这将为您提供。接下来的问题是你能忍受多慢?如果您有一个小型集群和数百万个数据分区,那么低数字不会产生太大的影响。
如果考虑每行计数的唯一值比率,您希望速度接近一对一。