我有一个表,它有一个存储一些blob数据的表的外键。当我在主表上使用条件对表进行内连接时,连接类型从'index'变为'ALL'。我想避免这种情况,因为我的blob表大约是几十千兆字节。我怎么能避免呢?
这是基本的内部联接:
EXPLAIN SELECT m.id, b.id, b.data
FROM metadata m, blobstore b
WHERE m.fkBlob = b.id;
1, 'SIMPLE', 'm', 'index', 'fk_blob', 'fk_blob', '4', '', 1, 'Using index'
1, 'SIMPLE', 'b', 'eq_ref', 'PRIMARY', 'PRIMARY', '4', 'blob_index.m.fkBlob', 1, ''
这里我在主表上添加一个条件:
EXPLAIN SELECT m.id, b.id, b.data
FROM metadata m, blobstore b
WHERE m.fkBlob = b.id AND m.start < '2009-01-01';
1, 'SIMPLE', 'b', 'ALL', 'PRIMARY', '', '', '', 1, ''
1, 'SIMPLE', 'm', 'ref', 'fk_blob,index_start', 'fk_blob', '4', 'blob_index.b.id', 1, 'Using where'
请注意,列表的顺序已更改。它现在在blob表上进行全表扫描,因为我已经添加了关于主表的条件。
这是架构:
DROP TABLE IF EXISTS `blob_index`.`metadata`;
CREATE TABLE `blob_index`.`metadata` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`fkBlob` int(10) unsigned NOT NULL,
`start` datetime NOT NULL,
PRIMARY KEY (`id`),
KEY `fk_blob` (`fkBlob`),
KEY `index_start` (`start`),
CONSTRAINT `fk_blob` FOREIGN KEY (`fkBlob`) REFERENCES `blobstore` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
DROP TABLE IF EXISTS `blob_index`.`blobstore`;
CREATE TABLE `blob_index`.`blobstore` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`data` mediumblob NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
答案 0 :(得分:3)
我猜你是在空表上尝试这个(因为MySQL认为它需要通过一行来进行全表扫描),这可能会影响调度程序的结果。当您在真实桌面上进行此操作时,EXPLAIN
结果可能会有所不同(实际上我的测试确实有所不同)。
答案 1 :(得分:3)
优化器认为您的查询将从交换表顺序中受益(这很可能意味着统计信息不是最新的)。
您可以尝试在metadata (start, fkBlob)
上添加索引:
CREATE INDEX ix_metadata_start_blob ON metadata (start, fkBlob)
并在两个表上运行ANALYZE TABLE
。
这样,start
上的索引将用于对metadata
进行过滤,这将成为领先者。
您还可以明确强制加入的顺序:
SELECT *
FROM metadata m
STRAIGHT_JOIN
blobstore b
ON b.id = m.fkBlob
WHERE m.start <= '2009-01-01'
,虽然通常不推荐。
答案 2 :(得分:0)
如果我阅读了您发布的内容,则会从index
转到ref
和eq_ref
转到all
。
CREATE INDEX idx_metadata USING BTREE ON `metadata` (fkBlob,start);
应该马上回来。
答案 3 :(得分:0)
if the index doesnot take it right use HINTS
select /* INDEX <index_name> */
blah blah blah
from ........
答案 4 :(得分:0)
在第一个示例中,MySQL使用元数据fk_blob索引,因为它是覆盖索引 - 您在查询中使用的每一列都存在于索引中。 (这就是“使用索引”的含义。)该查询仍然执行完整扫描,但它通过二级索引而不是主索引扫描每一行。一旦你使用了start,你就失去了覆盖索引,MySQL计算出使用blobstore作为驱动索引会更快。 (InnoDB的主要索引与行存储集成。)
如果您希望MySQL继续使用元数据索引作为驱动索引,请确保其上有一个对查询有用的索引。 (start,fkBlob)上的索引最适合第二个查询,但这对其他查询可能没有用。下一个最好的索引是用(fkBlob,start)替换(fkBlob)。您必须平衡具有太多索引(维护成本高昂)与高效查询计划。测试,测试,测试 - 永远不要盲目相信你的开发数据库的解释。