Question

我可以在表格中添加什么索引：

CREATE TABLE [WData](
    [Account] [varchar](50) NOT NULL,
    [Table] [varchar](50) NOT NULL,
    [BatchID] [datetime2](7) NOT NULL,
    [XmlRow] [xml] NULL
) ON [PRIMARY]

以便后续存储过程运行得更快？现在它很慢。

create PROCEDURE [Update_WData]
    @Account VARCHAR(50),
    @Table VARCHAR(50),
    @BatchID DATETIME2,
    @XmlRows xml 
AS
BEGIN
    SET NOCOUNT ON;

    DECLARE @input TABLE (
        [XmlRow] xml NULL
    );
    INSERT INTO @input (XmlRow)
    SELECT 
        c1.query('.')
    FROM @XmlRows.nodes('/Block/NewRow') AS t(c1);

    DECLARE @output TABLE ([ACTION] NVARCHAR(50) );

    MERGE WData AS t
    USING @input AS s 
    ON (t.Account = @Account AND t.[Table]=@Table AND CONVERT(VARCHAR(max),t.XmlRow)=CONVERT(VARCHAR(max),s.XmlRow))

    WHEN NOT MATCHED BY TARGET 
        THEN INSERT (Account,[Table],BatchID, [XmlRow]) 
        VALUES (@Account, @Table, @BatchID, s.XmlRow )
    WHEN MATCHED AND t.BatchID <> @BatchID
        THEN UPDATE SET t.BatchID = @BatchID
    OUTPUT 
        $ACTION
    INTO @output;
    SELECT [Action], COUNT(*) AS [Count]
    FROM @Output
    GROUP BY [Action]
END

Answer 1

您还没有告诉我们您的群集密钥的选择性，但我认为由于您遇到了性能问题，因此有多个行具有重复值。

用于匹配@input到WData的行的连接将是嵌套循环连接，并且在连接内侧对聚集索引进行搜索WData。来自@input的估计行数为1，因此SQL Server认为它需要在WData中执行范围搜索操作一次，以找到比较XML列内容所需的所有行。 / p>

假设您有{10000}行用于Account和[Table]的唯一组合，并且您的XML包含6个NewRow个节点，这些节点在@Input中被分解为六行。

enter image description here

聚集索引查找执行6次，每次返回10000行，然后比较连接中的XML列60000次。

您可以做的是添加一个计算的持久列，它是XML列的哈希值。

CREATE TABLE [WData](
    [Account] [varchar](50) NOT NULL,
    [Table] [varchar](50) NOT NULL,
    [BatchID] [datetime2](7) NOT NULL,
    [XmlRow] [xml] NULL,
    H AS CAST(HASHBYTES('SHA2_512', CAST([XmlRow] AS VARBINARY(MAX))) AS BINARY(64)) PERSISTED
) ON [PRIMARY]

并将计算列添加到@Input。

DECLARE @input TABLE (
    [XmlRow] XML NULL,
    H AS CAST(HASHBYTES('SHA2_512', CAST([XmlRow] AS VARBINARY(MAX))) AS BINARY(64)) PERSISTED
);

并使用H语句的ON子句中的MERGE列。

ON (
    t.Account = @Account AND 
    t.[Table]=@Table AND 
    t.H = s.H AND 
    CONVERT(VARCHAR(max),t.XmlRow)=CONVERT(VARCHAR(max),s.XmlRow)
   )

对于生成的哈希，您不太可能发生任何冲突（不同XML值的值相同），但哈希仅使用前8000个字节生成，因此您应该保留XML列的原始比较。

修改完成后，您最终会得到此查询计划。

enter image description here

读取次数相同，因为Clustered Index Seek仍然执行6次检查10000行。在查找中完成对哈希的检查作为残差谓词，使得运算符在这种情况下根本不返回任何行，因此在XML列上没有进行比较。

如果您不介意使用64字节扩展群集密钥，您还可以向密钥添加H并大幅降低读取次数。在我的测试中，它从1261下降到62.

CREATE CLUSTERED INDEX IX_WData ON WData(Account, [Table], H)

创建什么索引来加速T-SQL MERGE

1 个答案: