交叉应用不是高性能,转换为unpivot(或其他)?

时间:2017-08-19 09:16:36

标签: sql sql-server tsql unpivot cross-apply

插入大型数据集时交叉应用非常慢,我认为unpivot(或其他东西)可能更有效但除了使用交叉应用之外我无法弄清楚如何做到这一点:

CREATE TABLE LocData
    (Airport varchar(5), City varchar(5), Country varchar(5))
;

INSERT INTO LocData
    (Airport, City, Country)
VALUES
    ('LHR','LON','GB'),
    ('LGW','LON','GB'),
    ('LCY','LON','US'),
    ('JFK','NYC','US'),
    ('LGA','NYC','US'),
    ('EWR','NYC','US')
;

CREATE TABLE Travel
    (ID int, Dep varchar(5), Arr varchar(5))
;

INSERT INTO Travel
    (ID, Dep, Arr)
VALUES
    (1, 'LHR','JFK'),
    (2, 'LHR','EWR'),
    (3, 'LGA','LGW'),
    (4, 'LCY','EWR')
;

- 查询

select * from Travel;

select 
    c.*
    from Travel t
    join LocData dep on dep.Airport=t.Dep
    join LocData arr on arr.Airport=t.Arr
    cross apply
    (
    values 
    (t.ID, dep.Airport, 0, arr.Airport, 0),
    (t.ID, dep.City, 1, arr.City, 1),
    (t.ID, dep.Country, 2, arr.Country, 2)
    ) c (ID, Dep, DepType, Arr, ArrType);

你可以test it here (SQLFiddle)

1 个答案:

答案 0 :(得分:2)

您的查询是:

select c.*
from Travel t join
     LocData dep
     on dep.Airport = t.Dep join
     LocData arr
     on arr.Airport = t.Arr cross apply
     (values (t.ID, dep.Airport, 0, arr.Airport, 0),
             (t.ID, dep.City, 1, arr.City, 1),
             (t.ID, dep.Country, 2, arr.Country, 2)
    ) c(ID, Dep, DepType, Arr, ArrType);

这似乎是一种非常有效的方式来做你想做的事情。它应该有很好的表现。

提高绩效的一件事是Locadata(airport)上的索引。您还可以添加列citycountryinclude列或者添加其他键。我会使用它作为主键定义表(它会自动创建最佳类型的索引):

CREATE TABLE LocData (
    Airport varchar(5) PRIMARY KEY,
    City varchar(5),
    Country varchar(5)
);

(做出合理的假设,它永远不会NULL,永远不会重复。)

换句话说,我真诚地怀疑apply会影响表现。 join更有可能成为罪魁祸首。