为什么 SQL Server 选择了“错误”的索引?

时间:2021-01-14 18:45:34

标签: sql sql-server indexing sql-execution-plan

我有一个包含大约 2 亿条记录的事务表,一个主键聚集在 Id 和 2 个索引上:

  • IX_SiloId_ChangedTime_IncludeTime
  • IX_SiloId_Time_IncludeContent

在进行实际查询以更新统计信息之前,我运行了这 2 个语句

Update STATISTICS dbo.[Transaction] IX_SiloId_ChangedTime_IncludeTime WITH FULLSCAN
Update STATISTICS dbo.[Transaction] IX_SiloId_Time_IncludeContent WITH FULLSCAN

这是我的查询:

DECLARE @Query SiloTimeQueryTableType -- (SiloId, Time) with primary key clustered on SiloId
INSERT INTO @Query VALUES 
(1, '2020-12-31'), -- 1000 total values, though it's still the same problem with just one

SELECT  t.*
FROM    [Transaction] t
INNER JOIN @Query q
    ON t.SiloId = q.SiloId
WHERE 
    t.Time >= q.Time

现在无论出于何种原因Sql Server 选择IX_SiloId_ChangedTime_IncludeTime,都会发生什么。然后需要永远。如果我使用 WITH (INDEX(IX_SiloId_Time_IncludeContent)),我会立即得到结果。

正确的索引在这里很明显,但 SQL Server 选择了一个甚至没有在 Time 上建立索引的索引。

我无法理解这种行为,但从我读到的内容来看,最好避免索引的提示,尽管我在制作这个索引时考虑到了这个查询。

所以问题是:即使存在更好的索引并且我只运行完整的统计信息更新,我该怎么做才能弄清楚为什么 SQL Server 更喜欢“错误”的索引?

我创建了一个临时表,因为很多人都认为 TVP 失败了,但结果是一样的:

CREATE TABLE #Query
(
    SiloId bigint NOT NULL PRIMARY KEY CLUSTERED,
    Time datetime2(7) NOT NULL
)

执行计划:

https://www.brentozar.com/pastetheplan/?id=rJOt3G00P

https://www.brentozar.com/pastetheplan/?id=ByFshGAAP(这个是实时的,因为时间太长)

指数:

CREATE NONCLUSTERED INDEX [IX_SiloId_Time_IncludeContent] ON [dbo].[Transaction]
(
    [SiloId] ASC,
    [Time] ASC
)
INCLUDE([SiloContent]) WITH (STATISTICS_NORECOMPUTE = OFF, DROP_EXISTING = OFF, ONLINE = OFF, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]
GO
CREATE NONCLUSTERED INDEX [IX_SiloId_ChangedTime_IncludeTime] ON [dbo].[Transaction]
(
    [SiloId] ASC,
    [ChangedTime] ASC
)
INCLUDE([Time]) WITH (STATISTICS_NORECOMPUTE = OFF, DROP_EXISTING = OFF, ONLINE = OFF, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]
GO

1 个答案:

答案 0 :(得分:1)

<块引用>

无论出于何种原因 Sql Server 选择 IX_SiloId_ChangedTime_IncludeTime

这不是执行计划所说的。 SQL Server 在未指定索引提示时选择 delete from table1; delete from table2; delete from table3; 聚集索引。

我很清楚为什么 SQL Server 在查看执行计划时选择 PK_Transaction 而不是 PK_Transaction。原因是基数估计不佳。两个执行计划都显示 SQL Server 估计连接操作产生 2.5182.000 行,但实际上产生了 4.155 行。如果 SQL Server 选择 IX_SiloId_Time_IncludeContent,那么它估计需要执行 2.5182.000 次键查找。使用 IX_SiloId_Time_IncludeContent 索引进行 2.5182.000 次键查找时,该计划比具有哈希匹配和聚集索引扫描的计划更昂贵。如果 SQL Server 能够更好地估计,它会选择 IX_SiloId_Time_IncludeContent,因为只有 4.155 次键查找,该计划的成本要低得多。

所以,你能做什么?我认为有两个选择:

  • 包括索引提示。索引提示的存在是有原因的。基数估计不佳是包含提示的一个很好的理由。
  • 尝试使用第一个执行计划建议的覆盖索引。使用覆盖索引,不需要键查找。所以很有可能是SQL Server选择了覆盖索引。