目前我有一个接近100万行的表,我需要查询。我需要做的是根据产品ID的给定列表对它们包含的产品数量进行堆栈排序。
SELECT count(productID) AS commonProducts, packageID
FROM supply
WHERE productID IN (2,3,4,5,6,7,8,9,10)
GROUP BY packageID
ORDER BY commonProducts
DESC LIMIT 10
查询工作正常,但我想改进它。我在productID和packageID上尝试了一个多列索引,但它似乎寻找的行数多于每个列都有一个单独的索引。
MySQL解释
select_type: SIMPLE
table: supply
type: range
possible_keys: supplyID
key: supplyID
key_len: 3
ref: null
rows: 996
extra: Using where; Using temporary; Using filesort
我主要担心的是查询是使用临时表和filesort。我怎么能去优化这个查询呢?我认为最大的问题是count()和count()的结果上的ORDER BY。
答案 0 :(得分:3)
您可以使用Dependent Subquery:
删除临时表select * from
(
SELECT count(productID) AS commonProducts, s.productId, s.packageID
FROM supply as s
WHERE EXISTS
(
select 1 from supply as innerS
where innerS.productID in (2,3,4,5,6,7,8,9,10)
and s.productId = innerS.productId
)
GROUP BY s.packageID
) AS t
ORDER BY t.commonProducts
DESC LIMIT 10
内部查询链接到外部查询并保留索引。您会发现,对commonProducts进行排序的任何查询(包括上述查询)都将使用filesort,因为count(*)
绝对不会被编入索引。但是不用担心,filesort只是一个奇特的排序词 - mysql可以选择使用有效的内存排序 - 无论你现在是这样做还是在转向索引临时表的路上合并,你都会有在某个地方支付那种分拣费用。但是,这种情况非常好,因为一旦文件到达你所使用的LIMIT
,它就会停止排序。它不会对commonProducts的整个列表进行排序。
<强>更新强>
如果要一直运行此查询,我建议(不要过于花哨)在供应表上设置触发器来更新跟踪此类计数器的合法表。
答案 1 :(得分:1)
创建临时结果集:
SELECT TMP.*
FROM ( SELECT count(productID) AS commonProducts, packageID
FROM supply
WHERE productID IN (2,3,4,5,6,7,8,9,10)
GROUP BY packageID
) AS TMP
ORDER BY commonProducts
DESC LIMIT 10
答案 2 :(得分:0)
也许这不是最优雅的方式,我无法保证它会更快,因为一切都取决于您的特定数据。但在某些情况下,这会产生更好的结果:
SELECT count(*) AS commonProducts, packageID
FROM (
SELECT packageID FROM supply WHERE productID = 2
UNION ALL
SELECT packageID FROM supply WHERE productID = 3
UNION ALL
.
.
.
SELECT packageID FROM supply WHERE productID = 10
) AS t
GROUP BY packageID
ORDER BY commonProducts DESC
LIMIT 10