为什么mysql更喜欢扫描表而不是使用复合索引?

时间:2015-04-18 11:12:57

标签: mysql sql indexing

我有这张桌子:

业务:

bussId | x | y | bussStatus | 

我想运行此查询:

SELECT * FROM bussiness  WHERE  (bussiness.x BETWEEN 31.214857 AND 31.658529) AND (bussiness.y BETWEEN  34.502798 AND 34.918799) AND bussId > 500 AND bussStatus >0

EXPLAIN查询返回此结果:

Id : 1
select_type : SIMPLE
table : bussiness
type : range
possible_keys : PRIMARY,bussStatus,xy,bussId_xy_status
key : PRIMARY
key_len : 4
ref : NULL
rows : 134680
Extra : Using where

这表明mysql选择使用PRIMARY键,尽管有一个复合索引bussId_xy_status可以对x,y,status和bussId进行排序!

1 个答案:

答案 0 :(得分:2)

这是您的查询:

SELECT b.*
FROM business b
WHERE (b.x BETWEEN 31.214857 AND 31.658529) AND
      (b.y BETWEEN 34.502798 AND 34.918799) AND
      b.bussId > 500 AND
      b.bussStatus > 0;

WHERE子句中的所有比较都是不等式。这意味着复合索引的使用非常有限 - 只能最有效地使用索引中的第一列。优化器已决定使用主键进行全表扫描是最有效的,可能是因为bussid上的条件。 MySQL documentation对复合索引以及如何使用它们进行了很好的审查。

如果您需要进行这些类型的地理比较,可以考虑空间索引 - 请参阅here

编辑:

无赖。我引用的MySQL文档在解释多列索引方面做得不尽如人意。索引基本上提供两种访问功能:索引查找和索引扫描。查找允许索引转到恰当的值集。索引扫描允许索引标识两个值之间的所有行。 (最常见的索引类型是支持这两种操作的B树索引。)

考虑一个带有(a, b, c)索引的表t。当所有比较通过AND连接且至少一个比较在where时,索引可用于a子句。因此,该索引可用于:

where a = 'xyz'
where a > 'xyz'
where a in ('xyz', 'tbd')

首先是平等。第二个是不等式,因为单个索引查找是不够的。

索引不能(通常)用于:

where b = 'xyz'
where a = 'xyz' or b = 'xyz'

引入第二列时会发生什么?

where a = 'xyz' and b = 'abc'
where a > 'xyz' and b = 'abc'
where a in ('xyz', 'tbd') and b = 'abc'

索引可以完全用于第一种情况。对于后两个,只有索引的“a”部分被使用,如果有的话。优化器可能决定根本不使用索引,因为第一部分选择了太多行。

一般规则可以描述如下。多列索引可用于具有以下条件的where子句:

  • where子句中的所有比较都通过AND连接。
  • 对于索引中的第一个“n”键(“左前缀”),比较是相等的(即=IS NULL)。
  • n + 1键允许进行任何比较
  • “n”可以等于零

索引无法帮助“n + 1”键后的任何后续比较。它可以以另一种方式提供帮助,这是一种覆盖索引,但这是一个单独的主题。

在您的情况下,所有比较都是不等式,因此“n”为0.只有索引中的第一个键可以有效使用,并且优化器已经确定这不具有选择性,不足以提高效率。

另请注意,只要列上有函数,就不会使用索引。在您的情况下这不是问题,但是一些简单的事情:a + 0 = 0 可以阻止使用索引(我认为这个特定的示例可能在不同的数据库中以不同的方式工作)。

相关问题