Question

我有一个SQL查询，

SELECT 
  col1, 
  col2, 
  col3, (
    SELECT COUNT(id) 
    FROM B 
    WHERE B.aid = A.id
  ) AS col4 
FROM A

将select作为列有什么性能影响？是否会对返回的每一行执行该语句？

我真的只对这个查询的性能感兴趣。我知道还有其他方法可以完成计数。但在这种情况下，我只是想了解sql如何使用内联选择。

道歉，如果这个问题是一个骗局，我已经查看了stackoverflow，我无法在任何地方找到它。

Answer 1

这取决于您的SQL实现。

SQL是声明性的，由逻辑规范构建物理计划由优化器决定。 SQL Server可以decorrelate this sub query并变成OUTER JOIN

CREATE TABLE A(id INT PRIMARY KEY, col1 INT, col2 INT, col3 INT)

CREATE TABLE B(aid INT)

CREATE CLUSTERED INDEX ix ON B(aid)

/*Fool optimiser into thinking tables aren't empty*/
update statistics A with rowcount = 1000000, pagecount = 100000

update statistics B with rowcount = 1000000, pagecount = 100000

SELECT col1,
       col2,
       col3,
       (SELECT count( B.aid)
        FROM   B
        WHERE  B.aid = A.id) AS col4
FROM   A 

DROP TABLE A, B

提供计划

Plan

与

基本相同

SELECT col1,
       col2,
       col3,
       Cnt
FROM   (SELECT COUNT(aid) AS Cnt,
               aid
        FROM   B
        GROUP  BY aid) T
       RIGHT OUTER JOIN A
         ON A.id = T.aid

子查询在逻辑上表示为RIGHT OUTER JOIN，MERGE JOIN作为物理实现。合并连接处理每个输入一次，而不是嵌套循环连接的逐行行为。

select语句的SQL性能作为列

1 个答案: