我遇到了MYSQL的SELECT性能问题。
我有两个表“域”和“电子邮件”,其中包含重复项,这些表经常被不同来源更新(INSERT / DELETE)(大约每10分钟一次)。
我的主要目标是从桌子上制作两个视图而不重复。我知道一个视图是一个存储的查询,但这是我保持动态的唯一方法,创建一个没有重复的新表每隔几十分钟就会生气(也许不是?)。
另一个线程(后缀)使用这两个视图来检查收件人是否是允许的。当我尝试做一个简单的查询
SELECT email FROM emailview WHERE email = 'john@google.com'`
查询需要3-4秒。相反,如果我直接在电子邮件表上执行我的SELECT(有重复项),则需要0.01秒。
我如何改善系统上的SELECT性能,以获得与视图几乎相似的结果,而不是直接在桌面上?
以下是架构的详细信息(INNODB Engine,值1是随机的,并不重要):
域名表:
| field | type | null | key |
|--------------|--------------|------|------|
| domain | varchar(255) | NO | NULL |
| creationdate | datetime | NO | NULL |
| value 1 | varchar(255) | NO | NULL |
| source_fkey | varchar(255) | MUL | NULL |
| domain | creationdate | value 1 | source_fkey |
|------------|---------------------|-----------------------|
| google.com | 2013-05-28 15:35:01 | john | Y |
| google.com | 2013-04-30 12:10:10 | patrick | X |
| yahoo.com | 2011-04-02 13:10:10 | britney | Z |
| ebay.com | 2012-02-12 10:48:10 | harry | Y |
| ebay.com | 2013-04-15 07:15:23 | bill | X |
域视图(使用最早的创建日期删除重复的域):
CREATE VIEW domainview AS
SELECT domain.domain, creationdate, value1, source_fkey
FROM domain
WHERE (domain, creationdate) IN (SELECT domain, MIN(creationdate)
FROM domain GROUP BY domain);
| domain | creationdate | value 1 | source_fkey |
|------------|---------------------|-----------------------|
| google.com | 2013-04-30 12:10:10 | patrick | X |
| yahoo.com | 2011-04-02 13:10:10 | britney | Z |
| ebay.com | 2012-02-12 10:48:10 | harry | Y |
电子邮件表:
| field | type | null | key |
|--------------|--------------|------|------|
| email | varchar(255) | NO | NULL |
| source_fkey | varchar(255) | MUL | NULL |
| email | foreign_key |
|--------------------|-------------|
| john@google.com | X |
| john@google.com | Y | <-- duplicate from wrong foreign/domain
| harry@google.com | X |
| mickael@google.com | X |
| david@ebay.com | Y |
| alice@yahoo.com | Z |
电子邮件视图(来自域视图的domain / foreign_key的合法电子邮件和电子邮件):
CREATE VIEW emailview AS
SELECT email.email, email.foreign_key
FROM email, domainview
WHERE email.foreign_key = domainview.foreign_key
AND SUBSTRING_INDEX(email.email,'@',-1) = domainview.domain;
| email | foreign_key |
|--------------------|-------------|
| john@google.com | X |
| harry@google.com | X |
| mickael@google.com | X |
| david@ebay.com | Y |
| alice@yahoo.com | Z |
没有唯一的,没有索引,唯一的主键是在foreign_key所在的表中。
感谢您的帮助。
答案 0 :(得分:1)
两个查询都很慢 - 首先是因为IN
子句中的子选择 - 直到MySQL 5.6才进行优化;第二个因为在where子句中使用了一个函数。
在第一个查询中,您可以使用连接替换子选择 在第二种情况下,最好将域存储在单独的列中并将其用于比较
确保在连接,where和group by子句
中使用的字段上有复合索引