比NOT IN(嵌套选择)更有效的查询

时间:2014-09-09 22:55:01

标签: mysql sql performance

我有两个表table1table2,其定义是:

CREATE `table1` (
    'table1_id' int(11) NOT NULL AUTO_INCREMENT,
    'table1_name' VARCHAR(256),
     PRIMARY KEY ('table1_id')
)

CREATE `table2` (
    'table2_id' int(11) NOT NULL AUTO_INCREMENT,
    'table1_id' int(11) NOT NULL,
    'table1_name' VARCHAR(256),
     PRIMARY KEY ('table2_id'),
     FOREIGN KEY ('table1_id') REFERENCES 'table1' ('table1_id')
)

我想知道table1中未在table2中引用的行数,可以通过以下方式完成:

SELECT COUNT(t1.table1_id) FROM table1 t1 
WHERE t1.table1_id NOT IN (SELECT t2.table1_id FROM table2 t2)

是否有更有效的方法来执行此查询?

2 个答案:

答案 0 :(得分:3)

尝试使用EXISTS ..它通常比IN

更有效
SELECT COUNT(t1.table1_id) 
FROM table1 t1 
WHERE EXISTS
(   SELECT 1 
    FROM table2 t2
    WHERE t2.table1_id <=> t1.table1_id
)

你也可以使用NOT EXISTS

SELECT COUNT(t1.table1_id) 
FROM table1 t1 
WHERE NOT EXISTS
(   SELECT 1 
    FROM table2 t2
    WHERE t2.table1_id = t1.table1_id
)

EXISTS通常更快,因为执行计划一旦找到命中,它将退出搜索,因为条件已经证明是真的。 IN的问题是它会在进一步处理之前从子查询中收集所有结果......并且需要更长的时间

正如@billkarwin在注释中所提到的,EXISTS正在使用一个从属子查询。这是我的两个查询以及OP查询的解释。http://sqlfiddle.com/#!2/53199d/5

答案 1 :(得分:2)

升级到MySQL 5.6,它可以更好地优化对子查询的半连接。

请参阅http://dev.mysql.com/doc/refman/5.6/en/subquery-optimization.html

或者使用排除联接:

SELECT COUNT(t1.table1_id) FROM table1 t1 
LEFT OUTER JOIN table2 t2 USING (table1_id)
WHERE t2.table1_id IS NULL

另外,请确保table2.table1_id上有索引。