如何使用此基本内部联接避免全表扫描?

时间:2009-12-23 12:32:33

标签: mysql query-optimization blob inner-join

我有一个表,它有一个存储一些blob数据的表的外键。当我在主表上使用条件对表进行内连接时,连接类型从'index'变为'ALL'。我想避免这种情况,因为我的blob表大约是几十千兆字节。我怎么能避免呢?

这是基本的内部联接:

EXPLAIN SELECT m.id, b.id, b.data 
        FROM metadata m, blobstore b 
        WHERE m.fkBlob = b.id;

1, 'SIMPLE', 'm', 'index', 'fk_blob', 'fk_blob', '4', '', 1, 'Using index'
1, 'SIMPLE', 'b', 'eq_ref', 'PRIMARY', 'PRIMARY', '4', 'blob_index.m.fkBlob', 1, ''

这里我在主表上添加一个条件:

EXPLAIN SELECT m.id, b.id, b.data 
        FROM metadata m, blobstore b 
        WHERE m.fkBlob = b.id AND m.start < '2009-01-01';
1, 'SIMPLE', 'b', 'ALL', 'PRIMARY', '', '', '', 1, ''
1, 'SIMPLE', 'm', 'ref', 'fk_blob,index_start', 'fk_blob', '4', 'blob_index.b.id', 1, 'Using where'

请注意,列表的顺序已更改。它现在在blob表上进行全表扫描,因为我已经添加了关于主表的条件。

这是架构:

 DROP TABLE IF EXISTS `blob_index`.`metadata`;
    CREATE TABLE  `blob_index`.`metadata` (
      `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
      `fkBlob` int(10) unsigned NOT NULL,
      `start` datetime NOT NULL,
      PRIMARY KEY (`id`),
      KEY `fk_blob` (`fkBlob`),
      KEY `index_start` (`start`),
      CONSTRAINT `fk_blob` FOREIGN KEY (`fkBlob`) REFERENCES `blobstore` (`id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=latin1;


    DROP TABLE IF EXISTS `blob_index`.`blobstore`;
    CREATE TABLE  `blob_index`.`blobstore` (
      `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
      `data` mediumblob NOT NULL,
      PRIMARY KEY (`id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=latin1;

5 个答案:

答案 0 :(得分:3)

我猜你是在空表上尝试这个(因为MySQL认为它需要通过一行来进行全表扫描),这可能会影响调度程序的结果。当您在真实桌面上进行此操作时,EXPLAIN结果可能会有所不同(实际上我的测试确实有所不同)。

答案 1 :(得分:3)

优化器认为您的查询将从交换表顺序中受益(这很可能意味着统计信息不是最新的)。

您可以尝试在metadata (start, fkBlob)上添加索引:

CREATE INDEX ix_metadata_start_blob ON metadata (start, fkBlob)

并在两个表上运行ANALYZE TABLE

这样,start上的索引将用于对metadata进行过滤,这将成为领先者。

您还可以明确强制加入的顺序:

SELECT  *
FROM    metadata m
STRAIGHT_JOIN
        blobstore b
ON      b.id = m.fkBlob
WHERE   m.start <= '2009-01-01'

,虽然通常不推荐。

答案 2 :(得分:0)

如果我阅读了您发布的内容,则会从index转到refeq_ref转到all

CREATE INDEX idx_metadata USING BTREE ON `metadata` (fkBlob,start);

应该马上回来。

答案 3 :(得分:0)

if the index doesnot take it right use HINTS

select /* INDEX <index_name> */
blah blah blah
from ........

答案 4 :(得分:0)

在第一个示例中,MySQL使用元数据fk_blob索引,因为它是覆盖索引 - 您在查询中使用的每一列都存在于索引中。 (这就是“使用索引”的含义。)该查询仍然执行完整扫描,但它通过二级索引而不是主索引扫描每一行。一旦你使用了start,你就失去了覆盖索引,MySQL计算出使用blobstore作为驱动索引会更快。 (InnoDB的主要索引与行存储集成。)

如果您希望MySQL继续使用元数据索引作为驱动索引,请确保其上有一个对查询有用的索引。 (start,fkBlob)上的索引最适合第二个查询,但这对其他查询可能没有用。下一个最好的索引是用(fkBlob,start)替换(fkBlob)。您必须平衡具有太多索引(维护成本高昂)与高效查询计划。测试,测试,测试 - 永远不要盲目相信你的开发数据库的解释。