我可以在表格中添加什么索引:
CREATE TABLE [WData](
[Account] [varchar](50) NOT NULL,
[Table] [varchar](50) NOT NULL,
[BatchID] [datetime2](7) NOT NULL,
[XmlRow] [xml] NULL
) ON [PRIMARY]
以便后续存储过程运行得更快?现在它很慢。
create PROCEDURE [Update_WData]
@Account VARCHAR(50),
@Table VARCHAR(50),
@BatchID DATETIME2,
@XmlRows xml
AS
BEGIN
SET NOCOUNT ON;
DECLARE @input TABLE (
[XmlRow] xml NULL
);
INSERT INTO @input (XmlRow)
SELECT
c1.query('.')
FROM @XmlRows.nodes('/Block/NewRow') AS t(c1);
DECLARE @output TABLE ([ACTION] NVARCHAR(50) );
MERGE WData AS t
USING @input AS s
ON (t.Account = @Account AND t.[Table]=@Table AND CONVERT(VARCHAR(max),t.XmlRow)=CONVERT(VARCHAR(max),s.XmlRow))
WHEN NOT MATCHED BY TARGET
THEN INSERT (Account,[Table],BatchID, [XmlRow])
VALUES (@Account, @Table, @BatchID, s.XmlRow )
WHEN MATCHED AND t.BatchID <> @BatchID
THEN UPDATE SET t.BatchID = @BatchID
OUTPUT
$ACTION
INTO @output;
SELECT [Action], COUNT(*) AS [Count]
FROM @Output
GROUP BY [Action]
END
答案 0 :(得分:5)
您还没有告诉我们您的群集密钥的选择性,但我认为由于您遇到了性能问题,因此有多个行具有重复值。
用于匹配@input
到WData
的行的连接将是嵌套循环连接,并且在连接内侧对聚集索引进行搜索WData
。来自@input
的估计行数为1,因此SQL Server认为它需要在WData
中执行范围搜索操作一次,以找到比较XML列内容所需的所有行。 / p>
假设您有{10000}行用于Account
和[Table]
的唯一组合,并且您的XML包含6个NewRow
个节点,这些节点在@Input
中被分解为六行。
聚集索引查找执行6次,每次返回10000行,然后比较连接中的XML列60000次。
您可以做的是添加一个计算的持久列,它是XML列的哈希值。
CREATE TABLE [WData](
[Account] [varchar](50) NOT NULL,
[Table] [varchar](50) NOT NULL,
[BatchID] [datetime2](7) NOT NULL,
[XmlRow] [xml] NULL,
H AS CAST(HASHBYTES('SHA2_512', CAST([XmlRow] AS VARBINARY(MAX))) AS BINARY(64)) PERSISTED
) ON [PRIMARY]
并将计算列添加到@Input
。
DECLARE @input TABLE (
[XmlRow] XML NULL,
H AS CAST(HASHBYTES('SHA2_512', CAST([XmlRow] AS VARBINARY(MAX))) AS BINARY(64)) PERSISTED
);
并使用H
语句的ON
子句中的MERGE
列。
ON (
t.Account = @Account AND
t.[Table]=@Table AND
t.H = s.H AND
CONVERT(VARCHAR(max),t.XmlRow)=CONVERT(VARCHAR(max),s.XmlRow)
)
对于生成的哈希,您不太可能发生任何冲突(不同XML值的值相同),但哈希仅使用前8000个字节生成,因此您应该保留XML列的原始比较。
修改完成后,您最终会得到此查询计划。
读取次数相同,因为Clustered Index Seek仍然执行6次检查10000行。在查找中完成对哈希的检查作为残差谓词,使得运算符在这种情况下根本不返回任何行,因此在XML列上没有进行比较。
如果您不介意使用64字节扩展群集密钥,您还可以向密钥添加H
并大幅降低读取次数。在我的测试中,它从1261下降到62.
CREATE CLUSTERED INDEX IX_WData ON WData(Account, [Table], H)