如何在MySQL中建立一个连续的组?

时间:2009-10-22 23:31:35

标签: sql mysql group-by

如何在MySQL中返回有效的“连续”GROUP BY。换句话说,GROUP BY尊重记录集的顺序?

例如,下表中的SELECT MIN(col1), col2, COUNT(*) FROM table GROUP BY col2 ORDER BY col1,其中col1是唯一的有序索引:

1    a
2    a
3    b
4    b
5    a
6    a

返回:

1    a    4
3    b    2

但我需要返回以下内容:

1    a    2
3    b    2
5    a    2

7 个答案:

答案 0 :(得分:5)

使用:

   SELECT MIN(t.id) 'mi', 
          t.val, 
          COUNT(*)
     FROM (SELECT x.id, 
                 x.val, 
                 CASE 
                   WHEN xt.val IS NULL OR xt.val != x.val THEN 
                     @rownum := @rownum+1 
                   ELSE 
                     @rownum 
                 END AS grp
            FROM TABLE x
            JOIN (SELECT @rownum := 0) r
       LEFT JOIN (SELECT t.id +1 'id',
                         t.val
                    FROM TABLE t) xt ON xt.id = x.id) t
 GROUP BY t.val, t.grp
 ORDER BY mi

这里的关键是创建一个允许分组的人工值。

此前,更正了Guffa的答案:

   SELECT t.id, t.val
     FROM TABLE t
LEFT JOIN TABLE t2 on t2.id + 1 = t.id
    WHERE t2.val IS NULL 
       OR t.val <> t2.val

答案 1 :(得分:1)

如果col1中的数字是连续的,您可以这样做:

select x.col1, x.col2
from table x
left join table y on x.col1 = y.col1 + 1
where x.col2 <> isnull(y.col2, '')

它的工作原理如下:

-x-  -y-  out
1 a  - -  1 a
2 a  1 a
3 b  2 a  3 b
4 b  3 b
5 a  4 b  5 a
6 a  5 a

答案 2 :(得分:1)

与rexem相同的逻辑,但适用于任何具有窗口功能的RDBMS(尚不适用于MySQL):

CREATE TABLE tbl
(
id INT,
val VARCHAR(1)
);

INSERT INTO tbl(id,val) 
VALUES(1,'a'),(2,'a'),(3,'a'),(4,'a'),(5,'b'),(6,'b'),(7,'a'),(8,'a'),(9,'a');

源:

1 a
2 a
3 a
4 a
5 b
6 b
7 a
8 a
9 a

窗口式查询:(适用于支持窗口的rdbms):

WITH grouped_result AS
(
    SELECT x.id, x.val, 
        COUNT(CASE WHEN y.val IS NULL OR y.val <> x.val THEN 1 END) 
        OVER (ORDER BY x.id) AS grp
    FROM tbl x LEFT JOIN tbl y ON y.id + 1 = x.id
) 

SELECT MIN(id) mi, val, COUNT(*)
FROM grouped_result 
GROUP BY val, grp
ORDER BY mi

<强>输出:

1  a  4
5  b  2
7  a  3

BTW,这是没有GROUP BY的groups_result的结果:

1  a  1
2  a  1
3  a  1
4  a  1
5  b  2
6  b  2
7  a  3
8  a  3
9  a  3

感觉良好的重写mysqlism-query符合ANSI :-)目前,虽然mysql还没有窗口功能,但是rexem的答案是最好的。 Rexem,这是一个很好的mysql技术( JOIN(SELECT @rownum:= 0)),而afaik MSSQL和PostgreSQL不支持隐式声明的变量,kudos! : - )

答案 3 :(得分:0)

这不起作用:

SELECT min_col1 = MIN(col1), col2
FROM table
GROUP BY col2
ORDER BY min_col1

也许这个?

SELECT min_col1, col2
FROM ( SELECT min_col1 = MIN(col1), col2
       FROM table
       GROUP BY col2 ) x
ORDER BY min_col1

答案 4 :(得分:0)

Here是对omg-ponies提供的基本相同(我认为)解决方案的更长的描述 - “创建一个允许分组的人工价值”。

答案 5 :(得分:0)

我知道这个问题是在两年半前被问过的(我不希望任何upvote),但我刚遇到了完全相同的问题,除了'table'已经是一个非常复杂的SQL语句,所以我没有复制粘贴就无法进行任何连接

所以我有另一个想法:按col2排序并将当前行号减去col1的值

SELECT *, col1-(@rownum:=@rownum+1) FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t

结果如下:

1    a    0
2    a    0
5    a    2
6    a    2
3    b    -2
4    b    -2

现在您只需要按最后一列的值

进行分组
SELECT MIN(col1) AS mi, col2, COUNT(*) FROM 
    (SELECT *, col1-(@rownum:=@rownum+1) AS grp FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t) AS x
GROUP BY grp ORDER BY mi

答案 6 :(得分:0)

通过从总记录位置中减去类别内的位置来创建细分ID。然后,可以在GROUP BY中使用此细分ID。

create table temp1 (i int, c char);
insert into temp1 values (1,'a'),(2,'a'),(3,'b'),(4,'b'),(5,'a'),(6,'a');
with q1 as (
  select *, 
       row_number() over (order by i) - row_number() over (partition by c order by i) as segment
     from temp1 )
select min(i), c, count(*)
  from q1
  group by c, segment
  order by min(i);

Demo