SQL - 将非空邻接列表转换为路径

时间:2017-08-16 15:44:28

标签: sql sql-server path filesystems transitive-closure

我正在处理一些代表文件系统的表,我需要选择每个文件夹的完整路径作为扁平字符串。

第一个表列出了每个文件夹的详细信息:

CREATE TABLE Folders(
    FolderID int IDENTITY(1,1) NOT NULL,
    [Name] nvarchar(255) NOT NULL)

第二个表列出了文件夹关系的传递闭包:

CREATE TABLE FolderClosures(
    FolderClosuresID int IDENTITY(1,1) NOT NULL,
    AncestorFolderID int NOT NULL, --Foreign key to Folders.FolderID
    DescendantFolderID int NOT NULL --Foreign key to Folders.FolderID
    IsDirect bit NOT NULL)

对于样本数据,我们假设存在以下文件夹:

Documents/
Documents/Finance/
Documents/HumanResources/
Documents/HumanResources/Training/

这些将在以下表格中保留:

| FolderID | Name           |
+----------+----------------+
|        1 | Documents      |
|        2 | Finance        |
|        3 | HumanResources |
|        4 | Training       |

| FolderClosureID | AncestorFolderID | DescendantFolderID | IsDirect |
+-----------------+------------------+--------------------+----------+
|               1 |                1 |                  1 |        0 |
|               2 |                2 |                  2 |        0 |
|               3 |                1 |                  2 |        1 |
|               4 |                3 |                  3 |        0 |
|               5 |                1 |                  3 |        1 |
|               6 |                4 |                  4 |        0 |
|               7 |                1 |                  4 |        0 |
|               8 |                3 |                  4 |        1 |

需要注意的一些细节:

  1. 每个文件夹在FolderClosures中都有一个“标识行”,其中AncestorFolderID = DescendantFolderID AND IsDirect = 0

  2. 不是顶级文件夹的每个文件夹在FolderClosures中只有一行IsDirect = 1

  3. FolderClosures每个文件夹可以包含多行,其中AncestorFolderID <> DescendantFolderID AND IsDirect = 0。这些都代表了“祖父母”或更远的关系。

  4. 由于没有列可以为空,因此没有行明确声明给定文件夹是顶级文件夹。这只能通过检查FolderClosuresIsDirect = 1 AND DescendantFolderID = SomeID中哪些行SomeID | FolderID | Path | +----------+------------------------------------+ | 1 | Documents/ | | 2 | Documents/Finance/ | | 3 | Documents/HumanResources/ | | 4 | Documents/HumanResources/Training/ | 中没有行来识别。

  5. 我希望能够运行返回此数据的查询:

    <button [disabled]="counter !== 0">OK</button>
    

    文件夹可以无限深度嵌套,但实际上可能只有10个级别。查询可能需要返回几千个文件夹的路径。

    当数据作为邻接列表持久存在时,我发现了很多关于创建这种类型查询的建议,但是我还没有找到像这样的传递闭包设置的答案。我发现的邻接列表解决方案依赖于使用可空的父文件夹ID持久存储的行,但这在这里不起作用。

    如何获得所需的输出?

    如果有帮助,我使用的是SQL Server 2016。

1 个答案:

答案 0 :(得分:2)

获得所需输出的一种方法是执行递归查询。为此,我认为最好只使用具有IsDirect = 1的行,并将锚用作FolderClosures中没有直接父项的所有文件夹,这应该是您的所有根文件夹。< / p>

WITH FoldersCTE AS (
    SELECT  F.FolderID, CAST(F.Name as NVARCHAR(max)) Path
    FROM    Folders F
    WHERE   NOT EXISTS (
        SELECT 1 FROM FolderClosures FC WHERE FC.IsDirect = 1 AND FC.DescendantFolderID = F.FolderID
    )
    UNION ALL
    SELECT  F.FolderID, CONCAT(PF.Path, '\', F.Name)
    FROM    FoldersCTE PF
            INNER JOIN FolderClosures FC
                ON  FC.AncestorFolderID = PF.FolderId
                AND FC.IsDirect = 1
            INNER JOIN Folders F
                ON F.FolderID = FC.DescendantFolderID
)
SELECT * 
FROM    FoldersCTE  
OPTION (MAXRECURSION 1000) --> how many nested levels you think you will have

这会产生:

FolderID    Path
1           Documents
2           Documents\Finance
3           Documents\HumanResources
4           Documents\HumanResources\Training

希望它有所帮助。