我有一个简单的存储 过程,其中有多个WITH
子句。
一些代码是这样的:
WITH cteRowNums AS
(
SELECT
ROW_NUMBER() OVER(ORDER BY fcmp.EmpUserID, fcmp.WorkCellID, fcmp.ActivityTS) AS RowNumber,
fcmp.ActivityTS,
fcmp.ArtifactTypeID,
fcmp.ServerDateID,
fcmp.ServerHourID,
fcmp.EmpUserID,
fcmp.WorkCellID
FROM dbo.FactCassetteMarkingProcessing fcmp
WHERE ServerDateID >= '2007-01-01'
),
-- Make an attempt at identifying what each user did in their "session" by self-joining
cteJoinCurAndNext AS
(
SELECT
[Current Row].ArtifactTypeID,
[Current Row].ServerDateID,
[Current Row].ServerHourID,
[Current Row].EmpUserID,
[Current Row].WorkCellID
FROM cteRowNums [Current Row]
LEFT OUTER JOIN cteRowNums [Next Row] ON [Next Row].RowNumber = [Current Row].RowNumber + 1
WHERE [Current Row].ArtifactTypeID = 2
OR ([Current Row].ArtifactTypeID = 1 AND [Next Row].ArtifactTypeID = 2
AND [Current Row].EmpUserID = [Next Row].EmpUserID
AND [Current Row].WorkCellID = [Next Row].WorkCellID)
),
-- Do some aggregations
cteAggregates AS
(
SELECT
EmpUserID,
ServerDateID,
ServerHourID,
COUNT(NULLIF(ArtifactTypeID, 2)) AS SpecimensProcessedCount,
COUNT(NULLIF(ArtifactTypeID, 1)) AS BlocksProcessedCount
FROM cteJoinCurAndNext
GROUP BY EmpUserID, ServerDateID, ServerHourID
)
SELECT * FROM cteAggregates
问题是,对于大约2,5百万行,这需要花费大量时间。我在40分钟取消了执行查询。
如果我使用temporary
表更改这段代码,执行速度将大大加快。是否有任何方法仅使用CTEs
即可获得几乎相同的性能?
答案 0 :(得分:8)
有两个原因。
可能更重要的原因是SQL Server没有实现CTE。因此,对于每个参考,SQL Server都会重新计算整个CTE。据我所知,SQL Server也不对执行DAG进行常见的子查询优化,因此它总是重新生成CTES(尽管每个实例的执行计划可能不同)。
第二个原因是临时表具有统计信息,这些统计信息可以通知查询计划以创建更好的计划。
我怀疑您可以简化逻辑。但是,您需要问一个 new 问题,并说明您要做什么以及示例数据和所需结果。