Question

在这里，我的查询的大数据内连接存在性能问题，如下所示：

示例：

/* Creating table */

create table xyz
(
 colp1 nvarchar(10),
 colp2 nvarchar(10),
 coldt date,
 coltm datetime,
 coldr integer
);

/* Inserting records */ 

insert into xyz values('A','B','2014-08-02','10:00:00',50);
insert into xyz values('A','C','2014-08-02','11:08:08',120);
insert into xyz values('A','B','2014-08-02','11:08:55',160);
insert into xyz values('A','D','2014-08-03','09:00:15',180);
insert into xyz values('A','E','2014-08-04','11:00:10',600);
insert into xyz values('A','F','2014-08-04','11:05:50',320);
.
.
upto 50000

/* Query */

declare @testtable table(dt date,st time,et time)

insert into @testtable select coldt,coltm,DATEADD(ss,coldr,coltm) from xyz

select distinct colp1,colp2,coldt,
            coltm from xyz as x 
            inner join  
            @testtable  as t on convert(varchar,x.coltm,108) > t.st and 
            convert(varchar,x.coltm,108)< t.et;

花费大量时间对大量数据执行上述查询。

Answer 1

尝试将您的查询更改为

create TABLE #testtable (dt date,st time,et time)

insert into #testtable select coldt,coltm,DATEADD(ss,coldr,coltm) from xyz

select distinct colp1,colp2,coldt,
        coltm 
INTO #tmp2
from xyz as x 
inner join  #testtable  as t on convert(varchar,x.coltm,108) > t.st and 
        convert(varchar,x.coltm,108)< t.et;

这里的问题是使用表变量而不是临时表。以下是comparing table variable and temp table的文档。

Answer 2

您遇到性能问题是正常的，您使用没有索引的表变量来操作重要数据量。

我不明白使用此变量来获得结果，直接使用xys表会更加高效：

SELECT DISTINCT X.colp1
    ,X.colp2
    ,X.coldt
    ,X.coltm
FROM xyz X
INNER JOIN (SELECT Y.coldt AS [dt]
                 ,Y.coltm AS [st]
                 ,DATEADD(SS, Y.coldr, Y.coltm) AS [colet]) XT ON XT.st < CONVERT(VARCHAR, X.coltm, 108)
                                                                 AND XT.et > CONVERT(VARCHAR, X.coltm, 108)

通过使用这种方法，您可以充分利用表索引，并且它比使用表变量更高效。

当然，只有在表xys上定义索引时，这个解决方案才有意义（如果没有，现在就考虑这个问题非常重要）。

希望这会对你有所帮助。

SQL Server 2008：使用内部联接查询性能

2 个答案: