Question

以下是代码示例：

CREATE TABLE #titles(
    title_id       varchar(20),
    title          varchar(80)       NOT NULL,
    type           char(12)          NOT NULL,
    pub_id         char(4)               NULL,
    price          money                 NULL,
    advance        money                 NULL,
    royalty        int                   NULL,
    ytd_sales      int                   NULL,
    notes          varchar(200)          NULL,
    pubdate        datetime          NOT NULL
 )
 GO

 insert #titles values ('1', 'Secrets',   'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
 insert #titles values ('2', 'The',       'business',     '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
 insert #titles values ('3', 'Emotional', 'psychology',   '0736', $7.99,  $4000.00, 10, 3336,'Note 3','06/12/91')
 insert #titles values ('4', 'Prolonged', 'psychology',   '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
 insert #titles values ('5', 'With',      'business',     '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
 insert #titles values ('6', 'Valley',    'mod_cook',     '0877', $19.99, $0.00,    12, 2032,'Note 6','06/09/91')
 insert #titles values ('7', 'Any?',      'trad_cook',    '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
 insert #titles values ('8', 'Fifty',     'trad_cook',    '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
 GO


CREATE TABLE #sales(
    stor_id        char(4)           NOT NULL,
    ord_num        varchar(20)       NOT NULL,
    ord_date       datetime          NOT NULL,
    qty            smallint          NOT NULL,
    payterms       varchar(12)       NOT NULL,
    title_id       varchar(80)
)
 GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482',    '09/14/94', 10, 'Net 60',    '1')
insert #sales values('3', 'N914008',  '09/14/94', 20, 'Net 30',    '2')
insert #sales values('4', 'N914014',  '09/14/94', 25, 'Net 30',    '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')


SELECT    title, price
FROM      #titles
WHERE     EXISTS
(SELECT   *
FROM      #sales
WHERE     #sales.title_id = #titles.title_id
AND       qty >30)


    SELECT    t.title, t.price
    FROM     #titles t
    inner join #sales s on t.title_id = s.title_id
    where s.qty >30

我想知道上述2个查询之间有什么区别，它们给出了相同的结果。还想知道EXISTS关键字的用途以及确切使用的位置？

Answer 1

EXISTS用于返回布尔值，JOIN返回整个其他表格

EXISTS仅用于测试子查询是否返回结果，并且一旦发生短路就会发生短路。 JOIN用于通过将结果集与来自另一个具有关系的表中的其他字段进行组合来扩展结果集。

在您的示例中，查询在语义上是等效的。

通常，在以下情况下使用EXISTS：

您无需从相关表格中返回数据
您在相关表格中存在欺骗行为（如果重复值，JOIN会导致重复的行）
您想检查存在（使用而不是LEFT OUTER JOIN...NULL条件）

如果您有正确的索引，EXISTS的大部分时间都与JOIN完全相同。例外情况是非常复杂的子查询，使用EXISTS通常会更快。

如果您的JOIN密钥未编入索引，则使用EXISTS可能会更快，但您需要针对具体情况进行测试。

JOIN语法也更容易阅读和正常清晰。

Answer 2

EXISTS是半连接
JOIN是一个连接

所以有3行和5行匹配

JOIN提供15行
EXISTS提供3行

结果是其他人提到的“短路”效应，无需使用带有JOIN的DISTINCT。当寻找1：n关系的n侧存在行时，EXISTS几乎总是更快。

Answer 3

EXISTS主要用于快捷方式。本质上，优化器会在条件为真时挽救，因此可能不需要扫描整个表（在SQL Server的现代版本中，IN()也可以进行此优化，尽管这并非总是如此）。此行为可能因查询而异，在某些情况下，连接实际上可能会为优化器提供更多机会来完成其工作。所以我觉得很难说“这就是你应该使用EXISTS的时候，这就是你不应该”因为，就像许多事情一样，“它取决于它。”

也就是说，在这种情况下，由于表之间基本上只有1：1匹配，因此您不太可能看到任何性能差异，优化器可能会产生类似甚至相同的计划。当您为每个标题添加50,000行时，如果比较sales / exists在sales表上，您可能会看到不同的东西（更别提您需要更改连接查询以删除重复项，汇总，有什么）。

Answer 4

当我想要根据它们与其他行交互的方式排除行时，我发现存在最有用。

例如，

SELECT * 
  FROM TABLE a
 WHERE a.val IN (1,2,3)
   AND NOT EXISTS(SELECT NULL
                    FROM TABLE b
                   WHERE b.id = a.id
                     AND b.val NOT IN (1, 2, 3))

在这种情况下，我在a查询中排除了一行，其中b记录的ID相同但无效。

这实际上来自production problem I had at work。该查询移动了查询中的大部分排除逻辑而不是应用程序，将加载时间从超过24秒减少到2秒以下。： - ）

EXISTS vs JOIN和使用EXISTS子句

4 个答案: