为什么MySQL会使用索引交集而不是组合索引?

时间:2010-12-24 13:52:06

标签: mysql query-optimization sql-execution-plan database-indexes

我不时会遇到奇怪的MySQL行为。假设我有索引(type,rel,created),(type),(rel)。像这样的查询的最佳选择:

SELECT id FROM tbl
WHERE rel = 3 AND type = 3
ORDER BY created;

将使用索引(type, rel, created)。 但MySQL决定将索引(type)(rel)相交,这会导致性能更差。这是一个例子:

mysql> EXPLAIN
    -> SELECT id FROM tbl
    -> WHERE rel = 3 AND type = 3
    -> ORDER BY created\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: tbl
         type: index_merge
possible_keys: idx_type,idx_rel,idx_rel_type_created
          key: idx_type,idx_rel
      key_len: 1,2
          ref: NULL
         rows: 4343
        Extra: Using intersect(idx_type,idx_rel); Using where; Using filesort

同样的查询,但添加了提示:

mysql> EXPLAIN
    -> SELECT id FROM tbl USE INDEX (idx_type_rel_created)
    -> WHERE rel = 3 AND type = 3
    -> ORDER BY created\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: tbl
         type: ref
possible_keys: idx_type_rel_created
          key: idx_type_rel_created
      key_len: 3
          ref: const,const
         rows: 8906
        Extra: Using where

我认为MySQL采用的执行计划在EXPLAIN命令的“rows”列中包含较少的数字。从这个角度来看,4343行的索引交集看起来比使用8906行的组合索引要好。那么,问题可能在于这些数字吗?

mysql> SELECT COUNT(*) FROM tbl WHERE type=3 AND rel=3;
+----------+
| COUNT(*) |
+----------+
|     3056 |
+----------+

由此可以得出结论,MySQL错误地计算了组合索引的近似行数。

那么,我可以做些什么来让MySQL采取正确的执行计划?

我无法使用优化器提示,因为我必须坚持使用Django ORM 我发现的唯一解决方案是删除那些单字段索引。

MySQL版本是5.1.49。

表结构是:

CREATE TABLE tbl (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `type` tinyint(1) NOT NULL,
  `rel` smallint(2) NOT NULL,
  `created` datetime NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_type` (`type`),
  KEY `idx_rel` (`rel`),
  KEY `idx_type_rel_created` (`type`,`rel`,`created`)
) ENGINE=MyISAM;

2 个答案:

答案 0 :(得分:12)

很难确切地说明为什么MySQL在索引扫描中选择index_merge_intersection,但是您应该注意到,对于复合索引,将为复合索引存储直到给定列的统计信息。

复合索引的列information_schema.statistics.cardinality的{​​{1}}值将显示type的基数,而不是(rel, type)本身。

如果typerel之间存在相关性,则type的基数将小于单独(rel, type)rel的基数的乘积来自相应列的索引。

这就是错误计算行数的原因(交叉点的大小不能大于联合)。

您可以通过在type

中将其设置为关闭来禁止index_merge_intersection
@@optimizer_switch

答案 1 :(得分:3)

另一件值得一提的是:如果仅删除类型索引,则不会出现问题。索引不是必需的,因为它复制了复合索引的一部分。