MySQL查询优化。避免临时和文件排序

时间:2011-08-16 16:41:07

标签: mysql

目前我有一个接近100万行的表,我需要查询。我需要做的是根据产品ID的给定列表对它们包含的产品数量进行堆栈排序。

SELECT count(productID) AS commonProducts, packageID
FROM supply
WHERE productID IN (2,3,4,5,6,7,8,9,10) 
GROUP BY packageID 
ORDER BY commonProducts 
DESC LIMIT 10

查询工作正常,但我想改进它。我在productID和packageID上尝试了一个多列索引,但它似乎寻找的行数多于每个列都有一个单独的索引。

MySQL解释

select_type: SIMPLE
table: supply
type: range
possible_keys: supplyID
key: supplyID
key_len: 3
ref: null
rows: 996
extra: Using where; Using temporary; Using filesort

我主要担心的是查询是使用临时表和filesort。我怎么能去优化这个查询呢?我认为最大的问题是count()和count()的结果上的ORDER BY。

3 个答案:

答案 0 :(得分:3)

您可以使用Dependent Subquery

删除临时表
select * from 
  (
   SELECT count(productID) AS commonProducts, s.productId, s.packageID 
   FROM supply as s
   WHERE EXISTS
   (
      select 1 from supply as innerS 
        where innerS.productID in (2,3,4,5,6,7,8,9,10) 
          and s.productId = innerS.productId 
   )
   GROUP BY s.packageID
  ) AS t
ORDER BY t.commonProducts 
DESC LIMIT 10

内部查询链接到外部查询并保留索引。您会发现,对commonProducts进行排序的任何查询(包括上述查询)都将使用filesort,因为count(*)绝对不会被编入索引。但是不用担心,filesort只是一个奇特的排序词 - mysql可以选择使用有效的内存排序 - 无论你现在是这样做还是在转向索引临时表的路上合并,你都会有在某个地方支付那种分拣费用。但是,这种情况非常好,因为一旦文件到达你所使用的LIMIT,它就会停止排序。它不会对commonProducts的整个列表进行排序。

<强>更新

如果要一直运行此查询,我建议(不要过于花哨)在供应表上设置触发器来更新跟踪此类计数器的合法表。

答案 1 :(得分:1)

创建临时结果集:

SELECT  TMP.*
FROM (  SELECT count(productID) AS commonProducts, packageID
        FROM supply
        WHERE productID IN (2,3,4,5,6,7,8,9,10)
        GROUP BY packageID 
) AS TMP 

ORDER BY commonProducts 
DESC LIMIT 10

答案 2 :(得分:0)

也许这不是最优雅的方式,我无法保证它会更快,因为一切都取决于您的特定数据。但在某些情况下,这会产生更好的结果:

SELECT count(*) AS commonProducts, packageID
FROM (
    SELECT packageID FROM supply WHERE productID = 2
    UNION ALL
    SELECT packageID FROM supply WHERE productID = 3
    UNION ALL
    .
    .
    .
    SELECT packageID FROM supply WHERE productID = 10
) AS t
GROUP BY packageID
ORDER BY commonProducts DESC
LIMIT 10