如何使用SQL Server对范围值进行分组

时间:2009-01-23 12:38:27

标签: sql-server tsql common-table-expression gaps-and-islands

我有一个像这样的值表

978412, 400
978813, 20
978834, 50
981001, 20

正如您所看到的,添加到第一个数字时的第二个数字是序列中下一个数字之前的1个数字。最后一个数字不在范围内(不遵循直接序列,如下一个值)。我需要的是一个CTE(是的,理想情况下)将输出这个

978412, 472
981001, 20

第一行包含范围的起始编号,然后是其中节点的总和。下一行是下一个范围,在此示例中与原始数据相同。

2 个答案:

答案 0 :(得分:2)

从Josh发布的文章中,这是我的看法(测试和工作):

SELECT
    MAX(t1.gapID) as gapID,
    t2.gapID-MAX(t1.gapID)+t2.gapSize as gapSize
    -- max(t1) is the specific lower bound of t2 because of the group by.
FROM
  ( -- t1 is the lower boundary of an island.
    SELECT gapID
    FROM gaps tbl1 
    WHERE
      NOT EXISTS(
        SELECT *
        FROM gaps tbl2 
        WHERE tbl1.gapID = tbl2.gapID + tbl2.gapSize + 1
      )
  ) t1
  INNER JOIN ( -- t2 is the upper boundary of an island.
    SELECT gapID, gapSize
    FROM gaps tbl1 
    WHERE
      NOT EXISTS(
        SELECT * FROM gaps tbl2 
        WHERE tbl2.gapID = tbl1.gapID + tbl1.gapSize + 1
      )
  ) t2 ON t1.gapID <= t2.gapID -- For all t1, we get all bigger t2 and opposite.
GROUP BY t2.gapID, t2.gapSize

答案 1 :(得分:0)

查看此MSDN Article。它可以为您提供问题的解决方案,如果它适用于您,取决于您拥有的数据量以及查询的性能要求。

编辑:

使用查询中的示例,并使用他的最后一个解决方案第二种获取岛的方法(第一种方式导致SQL 2005出错)。

SELECT MIN(start) AS  startGroup, endGroup, (endgroup-min(start) +1) as NumNodes
FROM (SELECT g1.gapID AS start,
(SELECT min(g2.gapID) FROM #gaps g2 
WHERE g2.gapID >= g1.gapID and NOT EXISTS
(SELECT * FROM #gaps g3 
WHERE g3.gapID - g2.gapID = 1)) as endGroup
FROM #gaps g1) T1 GROUP BY endGroup

我添加的内容是(endgroup-min(start) +1) as NumNodes。这将给你计数。