Question

如何在MySQL中返回有效的“连续”GROUP BY。换句话说，GROUP BY尊重记录集的顺序？

例如，下表中的SELECT MIN(col1), col2, COUNT(*) FROM table GROUP BY col2 ORDER BY col1，其中col1是唯一的有序索引：

返回：

1    a    4
3    b    2

但我需要返回以下内容：

1    a    2
3    b    2
5    a    2

Answer 1

使用：

   SELECT MIN(t.id) 'mi', 
          t.val, 
          COUNT(*)
     FROM (SELECT x.id, 
                 x.val, 
                 CASE 
                   WHEN xt.val IS NULL OR xt.val != x.val THEN 
                     @rownum := @rownum+1 
                   ELSE 
                     @rownum 
                 END AS grp
            FROM TABLE x
            JOIN (SELECT @rownum := 0) r
       LEFT JOIN (SELECT t.id +1 'id',
                         t.val
                    FROM TABLE t) xt ON xt.id = x.id) t
 GROUP BY t.val, t.grp
 ORDER BY mi

这里的关键是创建一个允许分组的人工值。

此前，更正了Guffa的答案：

   SELECT t.id, t.val
     FROM TABLE t
LEFT JOIN TABLE t2 on t2.id + 1 = t.id
    WHERE t2.val IS NULL 
       OR t.val <> t2.val

Answer 2

如果col1中的数字是连续的，您可以这样做：

select x.col1, x.col2
from table x
left join table y on x.col1 = y.col1 + 1
where x.col2 <> isnull(y.col2, '')

它的工作原理如下：

-x-  -y-  out
1 a  - -  1 a
2 a  1 a
3 b  2 a  3 b
4 b  3 b
5 a  4 b  5 a
6 a  5 a

Answer 3

与rexem相同的逻辑，但适用于任何具有窗口功能的RDBMS（尚不适用于MySQL）：

CREATE TABLE tbl
(
id INT,
val VARCHAR(1)
);

INSERT INTO tbl(id,val) 
VALUES(1,'a'),(2,'a'),(3,'a'),(4,'a'),(5,'b'),(6,'b'),(7,'a'),(8,'a'),(9,'a');

源：

1 a
2 a
3 a
4 a
5 b
6 b
7 a
8 a
9 a

窗口式查询：（适用于支持窗口的rdbms）：

WITH grouped_result AS
(
    SELECT x.id, x.val, 
        COUNT(CASE WHEN y.val IS NULL OR y.val <> x.val THEN 1 END) 
        OVER (ORDER BY x.id) AS grp
    FROM tbl x LEFT JOIN tbl y ON y.id + 1 = x.id
) 

SELECT MIN(id) mi, val, COUNT(*)
FROM grouped_result 
GROUP BY val, grp
ORDER BY mi

<强>输出：

1  a  4
5  b  2
7  a  3

BTW，这是没有GROUP BY的groups_result的结果：

感觉良好的重写mysqlism-query符合ANSI :-)目前，虽然mysql还没有窗口功能，但是rexem的答案是最好的。 Rexem，这是一个很好的mysql技术（ JOIN（SELECT @rownum：= 0）），而afaik MSSQL和PostgreSQL不支持隐式声明的变量，kudos！： - ）

Answer 4

这不起作用：

SELECT min_col1 = MIN(col1), col2
FROM table
GROUP BY col2
ORDER BY min_col1

也许这个？

SELECT min_col1, col2
FROM ( SELECT min_col1 = MIN(col1), col2
       FROM table
       GROUP BY col2 ) x
ORDER BY min_col1

Answer 5

Here是对omg-ponies提供的基本相同（我认为）解决方案的更长的描述 - “创建一个允许分组的人工价值”。

Answer 6

我知道这个问题是在两年半前被问过的（我不希望任何upvote），但我刚遇到了完全相同的问题，除了'table'已经是一个非常复杂的SQL语句，所以我没有复制粘贴就无法进行任何连接

所以我有另一个想法：按col2排序并将当前行号减去col1的值

SELECT *, col1-(@rownum:=@rownum+1) FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t

结果如下：

1    a    0
2    a    0
5    a    2
6    a    2
3    b    -2
4    b    -2

现在您只需要按最后一列的值

进行分组

SELECT MIN(col1) AS mi, col2, COUNT(*) FROM 
    (SELECT *, col1-(@rownum:=@rownum+1) AS grp FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t) AS x
GROUP BY grp ORDER BY mi

Answer 7

通过从总记录位置中减去类别内的位置来创建细分ID。然后，可以在GROUP BY中使用此细分ID。

create table temp1 (i int, c char);
insert into temp1 values (1,'a'),(2,'a'),(3,'b'),(4,'b'),(5,'a'),(6,'a');
with q1 as (
  select *, 
       row_number() over (order by i) - row_number() over (partition by c order by i) as segment
     from temp1 )
select min(i), c, count(*)
  from q1
  group by c, segment
  order by min(i);

Demo

如何在MySQL中建立一个连续的组？

7 个答案: