需要添加哪些索引才能使此查询正常工作?

时间:2010-09-28 08:15:37

标签: mysql indexing performance

此查询会在我的慢查询日志中弹出:

SELECT
  COUNT(*)                 AS ordersCount,
  SUM(ItemsPrice + COALESCE(extrasPrice, 0.0)) AS totalValue,
  SUM(ItemsPrice)          AS totalValue,
  SUM(std_delivery_charge) AS totalStdDeliveryCharge,
  SUM(extra_delivery_charge) AS totalExtraDeliveryCharge,
  this_.type               AS y5_,
  this_.transmissionMethod AS y6_,
  this_.extra_delivery     AS y7_
FROM orders this_
WHERE this_.deliveryDate BETWEEN '2010-01-01 00:00:00' AND '2010-09-01 00:00:00'
    AND this_.status IN(1, 3, 2, 10, 4, 5, 11)
    AND this_.senderShop_id = 10017
GROUP BY this_.type, this_.transmissionMethod, this_.extra_delivery
ORDER BY this_.deliveryDate DESC;

该表是InnoDB,大约有880k行,需要9-12秒才能执行。我尝试添加以下索引ALTER TABLE orders ADD INDEX _deliverydate_senderShopId_status ( deliveryDate , senderShop_id , status, type, transmissionMethod, extra_delivery);但没有实际收益。欢迎任何帮助和/或建议

现在是查询执行计划:

id      select_type   table type    possible_keys   key                  key_len   ref    rows    filtered  Extra
1       SIMPLE        this_ ref                     FKC3DF62E57562BA6F   8         const  139894  100.00    Using where; Using temporary; Using filesort

我从text中取出了possible_keys值,因为我认为它列出了表中的所有索引。使用的密钥(FKC3DF62E57562BA6F)看起来像

Keyname               Type   Unique  Packed  Field          Cardinality Collation   Null    Comment
FKC3DF62E57562BA6F    BTREE  No      No      senderShop_id  4671        A

1 个答案:

答案 0 :(得分:1)

我会告诉你一件可以提高速度的事情。

对于未知或不适用的行,您通常只有NULL个值。在我看来,既然你将NULL视为0,你应该考虑摆脱它们,并确保所有extrasPrice值都是0它们之前是NULL,因此您可以摆脱coalesce的时间惩罚。

实际上,您可以更进一步,介绍另一个名为totalPrice列,您可以使用插入/更新触发器设置实际值ItemsPrice + extrasPrice或({ {1}}如果您仍然需要ItemsPrice + COALESCE(extrasPrice,0.0)的可空性。

然后,你可以简单地使用:

extrasPrice

(我不确定你应该有两个具有相同名称的输出列,或者这是否是一个拼写错误,在最坏的情况下,这将是一个错误,充其量是令人困惑的。)

这会将计算成本转移到插入/更新时间而不是选择时间,并在所有选择上分摊成本 - 大多数数据库表的读取频率远高于写入数据库。由于触发器而保持数据的一致性,并且性能应该更好,但需要一些存储要求。

但是,由于绝大多数数据库问题都是“如何才能获得更快的速度?”而不是“我如何使用更少的磁盘?”,这通常是一个好主意。

另一个建议是在列上提供非复合索引,以最快的速度减少结果集(高基数)。换句话说,如果您只在表格中存储了两周的数据(14个不同的日期),而在400个不同的商店,则应在SELECT COUNT(*) AS ordersCount, SUM(totalPrice) AS totalValue, SUM(ItemsPrice) AS totalValue2, : 上设置索引,并确保您的统计信息是最新的。

这应该会导致DBMS执行引擎使用该键减少结果集,以便后续操作更快。

senderShop_id上的综合索引将无法使用deliveryDate,senderShop_id,...来减少搜索结果,因为 {{1}中的密钥排序为senderShop_id }}