我希望可以发布这样的帖子。
我已经使用SQL很长一段时间了,工作中的人一直使用两种不同的方式在数据库中返回相同的数字或行。
例如:
SELECT Name
FROM
Employees
WHERE
DepartmentID IN (SELECT DepartmentID
FROM
Departments
WHERE
Department LIKE '%Engineering')
SELECT Employees.Name
FROM
Departments
INNER JOIN Employees
ON Departments.DepartmentID = Employees.DepartmentID
WHERE
Departments.Department LIKE '%Engineering'
两者都返回相同的数据。人们一直告诉我,使用子查询是最好的方法。
我的问题是: 这两个中的哪一个会执行得更快?我的猜测是内部联接,但我可能错了。
感谢。
答案 0 :(得分:5)
在这种情况下,两者都是等价的。但是,对于具有INNER JOIN的那个,如果选择了多个具有相同DepartmentID的部门,则具有该DepartmentID的员工将被多次返回。
SQL是一种声明性语言,这意味着该语言不应该说明应该如何执行查询,只应该找到应该找到的结果。由DMBS决定如何执行它。
一个体面的SQL数据库可能会优化它们以执行相同或类似的操作。
要检查他们是否做同样的事情,请在查询上运行EXPLAIN
。
如果他们有相同的步骤,显然他们将花费相同的时间来运行。否则,您将看到数据库以不同方式处理的方式。 DBMS如何优化它取决于实现。因此,最好的方法是使用EXPLAIN
。
注意:EXPLAIN是一个SQL命令,就像SELECT等。请参阅http://www.sql.org/sql-database/postgresql/manual/sql-explain.html。
假设它以相同的步骤执行,你编写它的方式将是你认为最清楚意图的方式。
答案 1 :(得分:4)
这两个查询不等同于。等同于“IN”查询的内容如下:
SELECT Name
FROM Employees e join
(SELECT distinct DepartmentID
FROM Departments
WHERE Department LIKE '%Engineering'
) d
on e.DepartmentID = d.DepartmentId
换句话说,“IN”版本永远不会返回重复的行。连接版本可以返回重复的行。在这种情况下,我认为不会因为离开表可能是独一无二的。
下一个问题是关于优化。 SQL引擎真的应该等效地优化这两个版本。这意味着“IN”版本更容易阅读。
但是,有一个很大的例外。对于IN来说,MySQL绝对不是最理想的。使用该数据库引擎时,使用连接版本要好得多。
顺便说一下,还有其他方法可以做到这一点,例如:
select name
from employees e
where exists (select 1 from Departments d
where e.Departmentid = d.DepartmentId and
d.Department LIKE '%Engineering'
)
哪种效果最好。 。 。你需要衡量你正在使用的数据库。
答案 2 :(得分:0)
大多数现代RDBMS中的查询优化器可能会以相同的方式在内部使用它们,因此不会有性能差异。
旧的RDBMS可能会显示差异,但这取决于RDBMS本身。