你能索引子查询吗?

时间:2014-11-20 14:50:57

标签: mysql indexing subquery

我有一个表和一个如下所示的查询。有关工作示例,请参阅此SQL Fiddle

SELECT o.property_B, SUM(o.score1), w.score
FROM o
INNER JOIN 
(
    SELECT o.property_B, SUM(o.score2) AS score FROM o GROUP BY property_B
) w ON w.property_B = o.property_B
WHERE o.property_A = 'specific_A'
GROUP BY property_B;

使用我的真实数据,此查询需要27秒。但是,如果我首先创建w作为临时表和索引property_B,它们总共需要大约1秒钟。

CREATE TEMPORARY TABLE w AS
SELECT o.property_B, SUM(o.score2) AS score FROM o GROUP BY property_B;

ALTER TABLE w ADD INDEX `property_B_idx` (property_B);

SELECT o.property_B, SUM(o.score1), w.score
FROM o
INNER JOIN w ON w.property_B = o.property_B
WHERE o.property_A = 'specific_A'
GROUP BY property_B;

DROP TABLE IF EXISTS w;

有没有办法结合这两个查询中最好的?即单个查询具有子查询中索引的速度优势吗?

修改

在下面的Mehran回答之后,我在MySQL documentation中阅读了这段解释:

从MySQL 5.6.3开始,优化器可以更有效地处理FROM子句中的子查询(即派生表):

...

对于FROM子句中子查询需要实现的情况,优化器可以通过向实现表添加索引来加快对结果的访问。如果这样的索引允许对表进行ref访问,则可以大大减少在查询执行期间必须读取的数据量。请考虑以下查询:

SELECT * FROM t1
  JOIN (SELECT * FROM t2) AS derived_t2 ON t1.f1=derived_t2.f1;

优化器在derived_t2的列f1上构造索引,如果这样做将允许对最低成本的执行计划使用ref访问。添加索引后,优化程序可以将具体化派生表视为与具有索引的常规表相同,并且它与生成的索引类似。与没有索引的查询执行成本相比,索引创建的开销可以忽略不计。如果ref访问会导致比其他访问方法更高的成本,则不会创建任何索引,并且优化程序也不会丢失任何内容。

4 个答案:

答案 0 :(得分:3)

首先,您需要知道创建临时表绝对是一个可行的解决方案。但是在没有其他选择适用的情况下这是不正确的!

在您的情况下,您可以轻松地提升您的查询 FrankPl 指出,因为您的子查询和主查询都是由同一字段进行分组。所以你不需要任何子查询。为了完整起见,我将复制并粘贴FrankPl的解决方案:

SELECT o.property_B, SUM(o.score1), SUM(o.score2)
FROM o
GROUP BY property_B;

然而,这并不意味着您无法遇到希望索引子查询的场景。在哪些情况下,您有两个选择,首先是使用您自己指出的临时表,并保留子查询的结果。这种解决方案很有用,因为MySQL长期以来都支持它。如果涉及大量数据,那就不可行了。

第二种解决方案是使用MySQL version 5.6 or above。在MySQL的最新版本中,新算法被合并,因此在子查询中使用的表上定义的索引也可以在子查询之外使用。

<强> [UPDATE]

对于问题的编辑版本,我建议采用以下解决方案:

SELECT o.property_B, SUM(IF(o.property_A = 'specific_A', o.score1, 0)), SUM(o.score2)
FROM o
GROUP BY property_B
HAVING SUM(IF(o.property_A = 'specific_A', o.score1, 0)) > 0;

但是你需要处理HAVING部分。您可能需要根据实际问题进行更改。

答案 1 :(得分:1)

MySQL应该优化您的查询,我不认为有一种方法可以动态创建索引。但是,您可以尝试强制使用property_o的索引(如果有的话)。见http://dev.mysql.com/doc/refman/5.1/en/index-hints.html

另外,如果您愿意,可以合并create和alter语句。

答案 2 :(得分:1)

我不明白为什么你需要加入。我会认为

SELECT o.property_B, SUM(o.score1), SUM(o.score2)
FROM o
GROUP BY property_B;

应该给出你想要的东西,但是更简单,因此更好地优化陈述。

答案 3 :(得分:1)

我对MySql并不熟悉,我主要使用Oracle。 如果您想在SUM中使用where子句,则可以使用decode或case。 它会看起来像那样

SELECT o.property_B, , SUM(decode(property_A, 'specific_A', o.score1, 0), SUM(o.score2)
FROM o
GROUP BY property_B;

或案例

SELECT o.property_B, , SUM(CASE
                            WHEN property_A = 'specific_A' THEN o.score1 
                            ELSE 0 
                            END ), 
SUM(o.score2)
FROM o
GROUP BY property_B;