有一个表,其中存储了以下视频观看日志的数据。
|user_id| status | time |
-------------------------------------
|user_a |start |2019-06-18 00:00:00|
|user_a |progress|2019-06-18 00:00:05|
|user_a |progress|2019-06-18 00:00:10|
|user_a |complete|2019-06-18 00:00:15|
|user_a |start |2019-06-18 00:10:00|
|user_a |complete|2019-06-18 00:10:05|
|user_a |start |2019-06-19 00:10:00|
|user_a |start |2019-06-19 00:10:05|
|user_a |progress|2019-06-19 00:10:10|
|user_b |start |2019-06-18 00:20:00|
|user_b |progress|2019-06-18 00:20:05|
|user_b |progress|2019-06-18 00:20:10|
我想为每个user_id从状态'start'到'start'的行赋予相同的编号,如下所示。
id|user_id| status | time |
-------------------------------------
1|user_a |start |2019-06-18 00:00:00|
1|user_a |progress|2019-06-18 00:00:05|
1|user_a |progress|2019-06-18 00:00:10|
1|user_a |complete|2019-06-18 00:00:15|
2|user_a |start |2019-06-18 00:10:00|
2|user_a |complete|2019-06-18 00:10:05|
3|user_a |start |2019-06-19 00:10:00|
4|user_a |start |2019-06-19 00:10:05|
4|user_a |progress|2019-06-19 00:10:10|
1|user_b |start |2019-06-18 00:20:00|
1|user_b |progress|2019-06-18 00:20:05|
1|user_b |progress|2019-06-18 00:20:10|
是否可以使用sql进行聚合? 我正在使用presto。
答案 0 :(得分:1)
使用累计金额:
select t.*,
sum(case when status = 'start' then 1 else 0 end) over (partition by user_id order by time) as id
from t;