我有两个表table1
和table2
,其定义是:
CREATE `table1` (
'table1_id' int(11) NOT NULL AUTO_INCREMENT,
'table1_name' VARCHAR(256),
PRIMARY KEY ('table1_id')
)
CREATE `table2` (
'table2_id' int(11) NOT NULL AUTO_INCREMENT,
'table1_id' int(11) NOT NULL,
'table1_name' VARCHAR(256),
PRIMARY KEY ('table2_id'),
FOREIGN KEY ('table1_id') REFERENCES 'table1' ('table1_id')
)
我想知道table1
中未在table2
中引用的行数,可以通过以下方式完成:
SELECT COUNT(t1.table1_id) FROM table1 t1
WHERE t1.table1_id NOT IN (SELECT t2.table1_id FROM table2 t2)
是否有更有效的方法来执行此查询?
答案 0 :(得分:3)
尝试使用EXISTS ..它通常比IN
更有效SELECT COUNT(t1.table1_id)
FROM table1 t1
WHERE EXISTS
( SELECT 1
FROM table2 t2
WHERE t2.table1_id <=> t1.table1_id
)
你也可以使用NOT EXISTS
SELECT COUNT(t1.table1_id)
FROM table1 t1
WHERE NOT EXISTS
( SELECT 1
FROM table2 t2
WHERE t2.table1_id = t1.table1_id
)
EXISTS通常更快,因为执行计划一旦找到命中,它将退出搜索,因为条件已经证明是真的。 IN的问题是它会在进一步处理之前从子查询中收集所有结果......并且需要更长的时间
正如@billkarwin在注释中所提到的,EXISTS正在使用一个从属子查询。这是我的两个查询以及OP查询的解释。http://sqlfiddle.com/#!2/53199d/5
答案 1 :(得分:2)
升级到MySQL 5.6,它可以更好地优化对子查询的半连接。
请参阅http://dev.mysql.com/doc/refman/5.6/en/subquery-optimization.html
或者使用排除联接:
SELECT COUNT(t1.table1_id) FROM table1 t1
LEFT OUTER JOIN table2 t2 USING (table1_id)
WHERE t2.table1_id IS NULL
另外,请确保table2.table1_id
上有索引。