关于SQL Server HierarchyID深度优先性能的问题

时间:2010-04-26 14:26:56

标签: sql tsql sql-server-2008 hierarchy hierarchyid

我正在尝试在表(dbo。[Message])中实现hierarchyID,其中包含大约50,000行(将来会大幅增长)。但是,检索大约25个结果需要30-40秒。

根节点是填充符,以便提供唯一性,因此每个后续行都是该虚拟行的子节点。

我需要能够遍历表深度优先并且使了hierarchyID列(dbo。[Message] .MessageID)聚类主键,还添加了一个计算的smallint(dbo。[Message] .Hierarchy)它存储节点的级别。

用法:.Net应用程序将hierarchyID值传递到数据库中,我希望能够检索该节点的所有(如果有)子节点和父节点(除根之外,因为它是填充程序)。

我正在使用的查询的简化版本:

@MessageID hierarchyID   /* passed in from application */

SELECT 
m.MessageID, m.MessageComment 

FROM 
dbo.[Message] as m

WHERE 
m.Messageid.IsDescendantOf(@MessageID.GetAncestor((@MessageID.GetLevel()-1))) = 1

ORDER BY 
m.MessageID

根据我的理解,应该在没有提示的情况下自动检测索引。

从搜索论坛我看到人们在处理广度优先索引时使用索引提示,但是在深度优先的情况下没有观察到这个应用程序。这对我的情景来说是一种相关的方法吗?

过去几天我一直试图找到解决这个问题的方法,但无济于事。 我非常感谢任何帮助,因为这是我的第一篇文章,我提前道歉,如果这被认为是一个'noobish'问题,我已经阅读了MS文档并搜索了无数的论坛,但没有看到一个简洁的描述具体问题。

2 个答案:

答案 0 :(得分:8)

您是否正在尝试优化深度优先或广度优先搜索尚不完全清楚;问题表明深度优先,但最后的评论是关于广度优先的。

您拥有深度优先所需的所有索引(只需索引hierarchyid列)。对于广度优先,仅仅创建计算的level列是不够的,您还必须将其编入索引:

ALTER TABLE Message
ADD [Level] AS MessageID.GetLevel()

CREATE INDEX IX_Message_BreadthFirst
ON Message (Level, MessageID)
INCLUDE (...)

(请注意,对于非聚集索引,您很可能需要INCLUDE - 否则,SQL Server可能会采用聚簇索引扫描。)

现在,如果您正在尝试查找节点的所有祖先,那么您希望采用稍微不同的方法。你可以快速地进行这些搜索,因为 - 这就是hierarchyid的优点 - 每个节点已经“包含”了它的所有祖先。

我使用CLR函数尽可能快地完成此操作,但您可以使用递归CTE执行此操作:

CREATE FUNCTION dbo.GetAncestors
(
    @h hierarchyid
)
RETURNS TABLE
AS RETURN
WITH Hierarchy_CTE AS
(
    SELECT @h AS id

    UNION ALL

    SELECT h.id.GetAncestor(1)
    FROM Hierarchy_CTE h
    WHERE h.id <> hierarchyid::GetRoot()
)
SELECT id FROM Hierarchy_CTE

现在,要获得所有的祖先和后代,请使用它:

DECLARE @MessageID hierarchyID   /* passed in from application */

SELECT m.MessageID, m.MessageComment 
FROM Message as m
WHERE m.MessageId.IsDescendantOf(@MessageID) = 1
OR m.MessageId IN (SELECT id FROM dbo.GetAncestors(@MessageID.GetAncestor(1)))
ORDER BY m.MessageID

尝试一下 - 这可以解决您的性能问题。

答案 1 :(得分:2)

找到解决方法: http://connect.microsoft.com/SQLServer/feedback/details/532406/performance-issue-with-hierarchyid-fun-isdescendantof-in-where-clause#

只是提醒我从应用程序传入的heirarchyID开始,我的目标是检索该值的所有亲属(祖先和后代)。

在我的具体示例中,我必须在SELECT语句之前添加以下声明:

declare @topNode hierarchyid = (select @messageID.GetAncestor((@messageID.GetLevel()-1)))
declare @topNodeParent hierarchyid = (select @topNode.GetAncestor(1))
declare @leftNode hierarchyid= (select @topNodeParent.GetDescendant (null, @topNode))
declare @rightNode hierarchyid= (select @topNodeParent.GetDescendant (@topNode, null))

WHERE子句已更改为:

messageid.IsDescendantOf(@topNode)=1 AND (messageid > @leftNode ) AND (messageid < @rightNode )

查询性能提升非常显着:

对于传入的每个结果,搜索时间现在平均为20毫秒(从120到420)。

当查询25个值时,之前需要25-35秒才能返回所有相关节点(在某些情况下,每个值都有很多亲戚,有些则没有)。现在只需2秒钟。

非常感谢所有在本网站和其他网站上为此问题做出贡献的人。