我正在尝试执行SQL查询。不幸的是,它不使用索引,而是进行表扫描。
我已经创建了以下索引:
另外,我重复了该表,但这也没有提供任何有用的结果。
这是表结构:
+--------------------+--------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+--------------------+--------------+------+-----+---------+-------+
| $id | varchar(100) | NO | | NULL | |
| $created_date | varchar(100) | YES | | NULL | |
| $phone | varchar(100) | NO | PRI | NULL | |
| $source | varchar(100) | YES | | NULL | |
| Orga | varchar(100) | YES | | NULL | |
| Anrede | varchar(100) | YES | | NULL | |
| Vorname | varchar(100) | YES | | NULL | |
| Zuname | varchar(100) | YES | | NULL | |
| Strasse | varchar(100) | YES | | NULL | |
| PLZ | varchar(100) | YES | | NULL | |
| Ort | varchar(100) | YES | | NULL | |
| Geburtsdatum | varchar(100) | YES | | NULL | |
| Email | varchar(100) | YES | | NULL | |
| Zeitschrift | varchar(100) | YES | | NULL | |
| Herkunft | varchar(100) | YES | | NULL | |
| Zeitschrift_Titel | varchar(100) | YES | | NULL | |
| telefon | varchar(100) | YES | | NULL | |
| Stornogrund | varchar(100) | YES | | NULL | |
| Storno | varchar(100) | YES | | NULL | |
| Telefonnummer | varchar(100) | YES | | NULL | |
| Postleitzahl | varchar(100) | YES | | NULL | |
| Geburtsjahr | varchar(100) | YES | | NULL | |
| $$fc_task | varchar(100) | YES | | NULL | |
| $$fc_user | varchar(100) | YES | | NULL | |
| $$fc_date | varchar(100) | NO | PRI | NULL | |
| $$fc_status | varchar(100) | YES | MUL | NULL | |
| $$fc_status_detail | varchar(100) | YES | MUL | NULL | |
| $$qc_task | varchar(100) | YES | | NULL | |
| $$qc_user | varchar(100) | YES | | NULL | |
| $$qc_date | varchar(100) | YES | | NULL | |
| $$qc_status | varchar(100) | YES | | NULL | |
| $$qc_status_detail | varchar(100) | YES | | NULL | |
| $call_duration | smallint(6) | YES | | NULL | |
| $call_attempts | smallint(6) | YES | | NULL | |
+--------------------+--------------+------+-----+---------+-------+
这是查询:
EXPLAIN SELECT
count(*) as total,
CONCAT(case when c1.$$fc_date < 240 then "short" else "long" end, "/", c1.$$fc_status, "/", c1.$$fc_status_detail) as ergebnis,
sum(case when c2.$$fc_status = 'success' then 1 else 0 end)/ count(*) as c2_succes_rate
FROM
contacts c1 FORCE INDEX (PRIMARY),
contacts_copy c2
WHERE
c1.$phone = c2.$phone
and c1.$$fc_date < c2.$$fc_date
group by
ergebnis
这是结果:
+------+-------------+-------+------+--------------------------------------------------------------+---------+---------+---------------+---------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+------+-------------+-------+------+--------------------------------------------------------------+---------+---------+---------------+---------+---------------------------------+
| 1 | SIMPLE | c1 | ALL | PRIMARY | NULL | NULL | NULL | 2017450 | Using temporary; Using filesort |
| 1 | SIMPLE | c2 | ref | PRIMARY,contacts_copy_$phone_IDX,contacts_copy_$$fc_date_IDX | PRIMARY | 402 | nmv.c1.$phone | 1 | Using where |
+------+-------------+-------+------+--------------------------------------------------------------+---------+---------+---------------+---------+---------------------------------+
如您在第1行中所见,尽管它可以识别PRIMARY键,但它不会使用它。问题是它扫描2Mio。行,查询持续至少5分钟。
任何人都可以解释一下,这可能是什么问题?
答案 0 :(得分:1)
您正在使用InnoDB,对吗? InnoDB辅助键(例如INDEX(phone)
)隐式包含PRIMARY KEY
的列。因此,索引实际上是(phone, fc_date)
的BTree。
接下来,让我们注意到c2
中需要另外一列:fc_status
。因此,优化程序研究了运行查询的两种方法。首先,请注意,这两种方法在索引中都有最佳列,并且它们的顺序最佳。
计划A:使用索引,然后在索引和数据之间来回跳动。
方案B:进行表格扫描,不需要来回扫描。
优化器正确选择了B。
您可以拥有一个更好的索引,优化器很可能会选择它。而且会更快:
INDEX(phone, fc_date, fc_status) -- in this order
这是“覆盖”的,因为存在所有需要的列。因此,不会有任何来回的回响。
我需要批评VARCHAR(100)
。这对于日期可能真的很不利,因为日期可能会根据格式而无法正确排序。
名称可能永远不会是100个字符;电子邮件可能会更长。等等4个电话号码?怎么了?