此查询会在我的慢查询日志中弹出:
SELECT
COUNT(*) AS ordersCount,
SUM(ItemsPrice + COALESCE(extrasPrice, 0.0)) AS totalValue,
SUM(ItemsPrice) AS totalValue,
SUM(std_delivery_charge) AS totalStdDeliveryCharge,
SUM(extra_delivery_charge) AS totalExtraDeliveryCharge,
this_.type AS y5_,
this_.transmissionMethod AS y6_,
this_.extra_delivery AS y7_
FROM orders this_
WHERE this_.deliveryDate BETWEEN '2010-01-01 00:00:00' AND '2010-09-01 00:00:00'
AND this_.status IN(1, 3, 2, 10, 4, 5, 11)
AND this_.senderShop_id = 10017
GROUP BY this_.type, this_.transmissionMethod, this_.extra_delivery
ORDER BY this_.deliveryDate DESC;
该表是InnoDB,大约有880k行,需要9-12秒才能执行。我尝试添加以下索引ALTER TABLE orders ADD INDEX _deliverydate_senderShopId_status ( deliveryDate , senderShop_id , status, type, transmissionMethod, extra_delivery);
但没有实际收益。欢迎任何帮助和/或建议
现在是查询执行计划:
id select_type table type possible_keys key key_len ref rows filtered Extra 1 SIMPLE this_ ref FKC3DF62E57562BA6F 8 const 139894 100.00 Using where; Using temporary; Using filesort
我从text中取出了possible_keys值,因为我认为它列出了表中的所有索引。使用的密钥(FKC3DF62E57562BA6F)看起来像
Keyname Type Unique Packed Field Cardinality Collation Null Comment FKC3DF62E57562BA6F BTREE No No senderShop_id 4671 A
答案 0 :(得分:1)
我会告诉你一件可以提高速度的事情。
对于未知或不适用的行,您通常只有NULL
个值。在我看来,既然你将NULL
视为0
,你应该考虑摆脱它们,并确保所有extrasPrice
值都是0
它们之前是NULL
,因此您可以摆脱coalesce
的时间惩罚。
实际上,您可以更进一步,介绍另一个名为totalPrice
的列,您可以使用插入/更新触发器设置实际值ItemsPrice + extrasPrice
或({ {1}}如果您仍然需要ItemsPrice + COALESCE(extrasPrice,0.0)
的可空性。
然后,你可以简单地使用:
extrasPrice
(我不确定你应该有两个具有相同名称的输出列,或者这是否是一个拼写错误,在最坏的情况下,这将是一个错误,充其量是令人困惑的。)
这会将计算成本转移到插入/更新时间而不是选择时间,并在所有选择上分摊成本 - 大多数数据库表的读取频率远高于写入数据库。由于触发器而保持数据的一致性,并且性能应该更好,但需要一些存储要求。
但是,由于绝大多数数据库问题都是“如何才能获得更快的速度?”而不是“我如何使用更少的磁盘?”,这通常是一个好主意。
另一个建议是在列上提供非复合索引,以最快的速度减少结果集(高基数)。换句话说,如果您只在表格中存储了两周的数据(14个不同的日期),而在400个不同的商店,则应在SELECT
COUNT(*) AS ordersCount,
SUM(totalPrice) AS totalValue,
SUM(ItemsPrice) AS totalValue2,
:
上设置索引,并确保您的统计信息是最新的。
这应该会导致DBMS执行引擎使用该键减少结果集,以便后续操作更快。
senderShop_id
上的综合索引将无法使用deliveryDate,senderShop_id,...
来减少搜索结果,因为 {{1}中的密钥排序为senderShop_id
}}