以下是代码示例:
CREATE TABLE #titles(
title_id varchar(20),
title varchar(80) NOT NULL,
type char(12) NOT NULL,
pub_id char(4) NULL,
price money NULL,
advance money NULL,
royalty int NULL,
ytd_sales int NULL,
notes varchar(200) NULL,
pubdate datetime NOT NULL
)
GO
insert #titles values ('1', 'Secrets', 'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
insert #titles values ('2', 'The', 'business', '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
insert #titles values ('3', 'Emotional', 'psychology', '0736', $7.99, $4000.00, 10, 3336,'Note 3','06/12/91')
insert #titles values ('4', 'Prolonged', 'psychology', '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
insert #titles values ('5', 'With', 'business', '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
insert #titles values ('6', 'Valley', 'mod_cook', '0877', $19.99, $0.00, 12, 2032,'Note 6','06/09/91')
insert #titles values ('7', 'Any?', 'trad_cook', '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
insert #titles values ('8', 'Fifty', 'trad_cook', '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
GO
CREATE TABLE #sales(
stor_id char(4) NOT NULL,
ord_num varchar(20) NOT NULL,
ord_date datetime NOT NULL,
qty smallint NOT NULL,
payterms varchar(12) NOT NULL,
title_id varchar(80)
)
GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482', '09/14/94', 10, 'Net 60', '1')
insert #sales values('3', 'N914008', '09/14/94', 20, 'Net 30', '2')
insert #sales values('4', 'N914014', '09/14/94', 25, 'Net 30', '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')
SELECT title, price
FROM #titles
WHERE EXISTS
(SELECT *
FROM #sales
WHERE #sales.title_id = #titles.title_id
AND qty >30)
SELECT t.title, t.price
FROM #titles t
inner join #sales s on t.title_id = s.title_id
where s.qty >30
我想知道上述2个查询之间有什么区别,它们给出了相同的结果。还想知道EXISTS关键字的用途以及确切使用的位置?
答案 0 :(得分:94)
EXISTS
用于返回布尔值,JOIN
返回整个其他表格
EXISTS
仅用于测试子查询是否返回结果,并且一旦发生短路就会发生短路。 JOIN
用于通过将结果集与来自另一个具有关系的表中的其他字段进行组合来扩展结果集。
在您的示例中,查询在语义上是等效的。
通常,在以下情况下使用EXISTS
:
JOIN
会导致重复的行)LEFT OUTER JOIN...NULL
条件)如果您有正确的索引,EXISTS
的大部分时间都与JOIN
完全相同。例外情况是非常复杂的子查询,使用EXISTS
通常会更快。
如果您的JOIN
密钥未编入索引,则使用EXISTS
可能会更快,但您需要针对具体情况进行测试。
JOIN
语法也更容易阅读和正常清晰。
答案 1 :(得分:37)
所以有3行和5行匹配
结果是其他人提到的“短路”效应,无需使用带有JOIN的DISTINCT。当寻找1:n关系的n侧存在行时,EXISTS几乎总是更快。
答案 2 :(得分:10)
EXISTS
主要用于快捷方式。本质上,优化器会在条件为真时挽救,因此可能不需要扫描整个表(在SQL Server的现代版本中,IN()
也可以进行此优化,尽管这并非总是如此)。此行为可能因查询而异,在某些情况下,连接实际上可能会为优化器提供更多机会来完成其工作。所以我觉得很难说“这就是你应该使用EXISTS
的时候,这就是你不应该”因为,就像许多事情一样,“它取决于它。”
也就是说,在这种情况下,由于表之间基本上只有1:1匹配,因此您不太可能看到任何性能差异,优化器可能会产生类似甚至相同的计划。当您为每个标题添加50,000行时,如果比较sales / exists在sales表上,您可能会看到不同的东西(更别提您需要更改连接查询以删除重复项,汇总,有什么)。
答案 3 :(得分:3)
当我想要根据它们与其他行交互的方式排除行时,我发现存在最有用。
例如,
SELECT *
FROM TABLE a
WHERE a.val IN (1,2,3)
AND NOT EXISTS(SELECT NULL
FROM TABLE b
WHERE b.id = a.id
AND b.val NOT IN (1, 2, 3))
在这种情况下,我在a
查询中排除了一行,其中b
记录的ID相同但无效。
这实际上来自production problem I had at work。该查询移动了查询中的大部分排除逻辑而不是应用程序,将加载时间从超过24秒减少到2秒以下。 : - )