在这里,我的查询的大数据内连接存在性能问题,如下所示:
示例:
/* Creating table */
create table xyz
(
colp1 nvarchar(10),
colp2 nvarchar(10),
coldt date,
coltm datetime,
coldr integer
);
/* Inserting records */
insert into xyz values('A','B','2014-08-02','10:00:00',50);
insert into xyz values('A','C','2014-08-02','11:08:08',120);
insert into xyz values('A','B','2014-08-02','11:08:55',160);
insert into xyz values('A','D','2014-08-03','09:00:15',180);
insert into xyz values('A','E','2014-08-04','11:00:10',600);
insert into xyz values('A','F','2014-08-04','11:05:50',320);
.
.
upto 50000
/* Query */
declare @testtable table(dt date,st time,et time)
insert into @testtable select coldt,coltm,DATEADD(ss,coldr,coltm) from xyz
select distinct colp1,colp2,coldt,
coltm from xyz as x
inner join
@testtable as t on convert(varchar,x.coltm,108) > t.st and
convert(varchar,x.coltm,108)< t.et;
花费大量时间对大量数据执行上述查询。
答案 0 :(得分:1)
尝试将您的查询更改为
create TABLE #testtable (dt date,st time,et time)
insert into #testtable select coldt,coltm,DATEADD(ss,coldr,coltm) from xyz
select distinct colp1,colp2,coldt,
coltm
INTO #tmp2
from xyz as x
inner join #testtable as t on convert(varchar,x.coltm,108) > t.st and
convert(varchar,x.coltm,108)< t.et;
这里的问题是使用表变量而不是临时表。以下是comparing table variable and temp table的文档。
答案 1 :(得分:0)
您遇到性能问题是正常的,您使用没有索引的表变量来操作重要数据量。
我不明白使用此变量来获得结果,直接使用xys表会更加高效:
SELECT DISTINCT X.colp1
,X.colp2
,X.coldt
,X.coltm
FROM xyz X
INNER JOIN (SELECT Y.coldt AS [dt]
,Y.coltm AS [st]
,DATEADD(SS, Y.coldr, Y.coltm) AS [colet]) XT ON XT.st < CONVERT(VARCHAR, X.coltm, 108)
AND XT.et > CONVERT(VARCHAR, X.coltm, 108)
通过使用这种方法,您可以充分利用表索引,并且它比使用表变量更高效。
当然,只有在表xys上定义索引时,这个解决方案才有意义(如果没有,现在就考虑这个问题非常重要)。
希望这会对你有所帮助。