如何在MySQL中返回有效的“连续”GROUP BY。换句话说,GROUP BY尊重记录集的顺序?
例如,下表中的SELECT MIN(col1), col2, COUNT(*) FROM table GROUP BY col2 ORDER BY col1
,其中col1是唯一的有序索引:
1 a 2 a 3 b 4 b 5 a 6 a
返回:
1 a 4 3 b 2
但我需要返回以下内容:
1 a 2 3 b 2 5 a 2
答案 0 :(得分:5)
使用:
SELECT MIN(t.id) 'mi',
t.val,
COUNT(*)
FROM (SELECT x.id,
x.val,
CASE
WHEN xt.val IS NULL OR xt.val != x.val THEN
@rownum := @rownum+1
ELSE
@rownum
END AS grp
FROM TABLE x
JOIN (SELECT @rownum := 0) r
LEFT JOIN (SELECT t.id +1 'id',
t.val
FROM TABLE t) xt ON xt.id = x.id) t
GROUP BY t.val, t.grp
ORDER BY mi
这里的关键是创建一个允许分组的人工值。
此前,更正了Guffa的答案:
SELECT t.id, t.val
FROM TABLE t
LEFT JOIN TABLE t2 on t2.id + 1 = t.id
WHERE t2.val IS NULL
OR t.val <> t2.val
答案 1 :(得分:1)
如果col1中的数字是连续的,您可以这样做:
select x.col1, x.col2
from table x
left join table y on x.col1 = y.col1 + 1
where x.col2 <> isnull(y.col2, '')
它的工作原理如下:
-x- -y- out
1 a - - 1 a
2 a 1 a
3 b 2 a 3 b
4 b 3 b
5 a 4 b 5 a
6 a 5 a
答案 2 :(得分:1)
与rexem相同的逻辑,但适用于任何具有窗口功能的RDBMS(尚不适用于MySQL):
CREATE TABLE tbl
(
id INT,
val VARCHAR(1)
);
INSERT INTO tbl(id,val)
VALUES(1,'a'),(2,'a'),(3,'a'),(4,'a'),(5,'b'),(6,'b'),(7,'a'),(8,'a'),(9,'a');
源:
1 a
2 a
3 a
4 a
5 b
6 b
7 a
8 a
9 a
窗口式查询:(适用于支持窗口的rdbms):
WITH grouped_result AS
(
SELECT x.id, x.val,
COUNT(CASE WHEN y.val IS NULL OR y.val <> x.val THEN 1 END)
OVER (ORDER BY x.id) AS grp
FROM tbl x LEFT JOIN tbl y ON y.id + 1 = x.id
)
SELECT MIN(id) mi, val, COUNT(*)
FROM grouped_result
GROUP BY val, grp
ORDER BY mi
<强>输出:强>
1 a 4
5 b 2
7 a 3
BTW,这是没有GROUP BY的groups_result的结果:
1 a 1
2 a 1
3 a 1
4 a 1
5 b 2
6 b 2
7 a 3
8 a 3
9 a 3
感觉良好的重写mysqlism-query符合ANSI :-)目前,虽然mysql还没有窗口功能,但是rexem的答案是最好的。 Rexem,这是一个很好的mysql技术( JOIN(SELECT @rownum:= 0)),而afaik MSSQL和PostgreSQL不支持隐式声明的变量,kudos! : - )
答案 3 :(得分:0)
这不起作用:
SELECT min_col1 = MIN(col1), col2
FROM table
GROUP BY col2
ORDER BY min_col1
也许这个?
SELECT min_col1, col2
FROM ( SELECT min_col1 = MIN(col1), col2
FROM table
GROUP BY col2 ) x
ORDER BY min_col1
答案 4 :(得分:0)
Here是对omg-ponies提供的基本相同(我认为)解决方案的更长的描述 - “创建一个允许分组的人工价值”。
答案 5 :(得分:0)
我知道这个问题是在两年半前被问过的(我不希望任何upvote),但我刚遇到了完全相同的问题,除了'table'已经是一个非常复杂的SQL语句,所以我没有复制粘贴就无法进行任何连接
所以我有另一个想法:按col2排序并将当前行号减去col1的值
SELECT *, col1-(@rownum:=@rownum+1) FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t
结果如下:
1 a 0
2 a 0
5 a 2
6 a 2
3 b -2
4 b -2
现在您只需要按最后一列的值
进行分组SELECT MIN(col1) AS mi, col2, COUNT(*) FROM
(SELECT *, col1-(@rownum:=@rownum+1) AS grp FROM (SELECT * FROM table JOIN (SELECT @rownum:=0) AS i ORDER BY col2) AS t) AS x
GROUP BY grp ORDER BY mi
答案 6 :(得分:0)
通过从总记录位置中减去类别内的位置来创建细分ID。然后,可以在GROUP BY中使用此细分ID。
create table temp1 (i int, c char);
insert into temp1 values (1,'a'),(2,'a'),(3,'b'),(4,'b'),(5,'a'),(6,'a');
with q1 as (
select *,
row_number() over (order by i) - row_number() over (partition by c order by i) as segment
from temp1 )
select min(i), c, count(*)
from q1
group by c, segment
order by min(i);