我不时会遇到奇怪的MySQL行为。假设我有索引(type,rel,created),(type),(rel)。像这样的查询的最佳选择:
SELECT id FROM tbl
WHERE rel = 3 AND type = 3
ORDER BY created;
将使用索引(type, rel, created)
。
但MySQL决定将索引(type)
和(rel)
相交,这会导致性能更差。这是一个例子:
mysql> EXPLAIN
-> SELECT id FROM tbl
-> WHERE rel = 3 AND type = 3
-> ORDER BY created\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tbl
type: index_merge
possible_keys: idx_type,idx_rel,idx_rel_type_created
key: idx_type,idx_rel
key_len: 1,2
ref: NULL
rows: 4343
Extra: Using intersect(idx_type,idx_rel); Using where; Using filesort
同样的查询,但添加了提示:
mysql> EXPLAIN
-> SELECT id FROM tbl USE INDEX (idx_type_rel_created)
-> WHERE rel = 3 AND type = 3
-> ORDER BY created\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: tbl
type: ref
possible_keys: idx_type_rel_created
key: idx_type_rel_created
key_len: 3
ref: const,const
rows: 8906
Extra: Using where
我认为MySQL采用的执行计划在EXPLAIN命令的“rows”列中包含较少的数字。从这个角度来看,4343行的索引交集看起来比使用8906行的组合索引要好。那么,问题可能在于这些数字吗?
mysql> SELECT COUNT(*) FROM tbl WHERE type=3 AND rel=3;
+----------+
| COUNT(*) |
+----------+
| 3056 |
+----------+
由此可以得出结论,MySQL错误地计算了组合索引的近似行数。
那么,我可以做些什么来让MySQL采取正确的执行计划?
我无法使用优化器提示,因为我必须坚持使用Django ORM 我发现的唯一解决方案是删除那些单字段索引。
MySQL版本是5.1.49。
表结构是:
CREATE TABLE tbl (
`id` int(11) NOT NULL AUTO_INCREMENT,
`type` tinyint(1) NOT NULL,
`rel` smallint(2) NOT NULL,
`created` datetime NOT NULL,
PRIMARY KEY (`id`),
KEY `idx_type` (`type`),
KEY `idx_rel` (`rel`),
KEY `idx_type_rel_created` (`type`,`rel`,`created`)
) ENGINE=MyISAM;
答案 0 :(得分:12)
很难确切地说明为什么MySQL
在索引扫描中选择index_merge_intersection
,但是您应该注意到,对于复合索引,将为复合索引存储直到给定列的统计信息。
复合索引的列information_schema.statistics.cardinality
的{{1}}值将显示type
的基数,而不是(rel, type)
本身。
如果type
和rel
之间存在相关性,则type
的基数将小于单独(rel, type)
和rel
的基数的乘积来自相应列的索引。
这就是错误计算行数的原因(交叉点的大小不能大于联合)。
您可以通过在type
index_merge_intersection
@@optimizer_switch
答案 1 :(得分:3)
另一件值得一提的是:如果仅删除类型索引,则不会出现问题。索引不是必需的,因为它复制了复合索引的一部分。