我想按升序顺序聚合2个字段proct_dt,dw_job_id 通过使用以下查询和结果,我的方案将很清楚。
首先查询: -
sel * from scratch.COGIPF_RUNREPORT_test1 order by proct_dt,dw_job_id其中dw_job_id = 10309
输出: -
dw_job_id proct_dt start_ts end_ts time_diff
1 10,309 2018-03-06 00:00:00 2018-03-06 07:04:18 2018-03-06 07:04:22.457000 0
2 10,309 2018-03-06 00:00:00 2018-03-06 06:58:50 2018-03-06 06:58:51.029000 0
3 10,309 2018-03-07 00:00:00 2018-03-07 06:35:36 2018-03-07 06:36:03.809000 1
4 10,309 2018-03-06 00:00:00 2018-03-06 07:00:35 2018-03-06 07:00:40.702000 0
5 10,309 2018-03-06 00:00:00 2018-03-06 06:30:25 2018-03-06 06:30:42.759000 0
6 10,309 2018-03-06 00:00:00 2018-03-06 07:10:27 2018-03-06 07:10:28.715000 0
7 10,309 2018-03-06 00:00:00 2018-03-06 06:59:44 2018-03-06 06:59:48.315000 0
8 10,309 2018-03-06 00:00:00 2018-03-06 07:00:15 2018-03-06 07:00:15.086000 0
9 10,309 2018-03-06 00:00:00 2018-03-06 07:04:02 2018-03-06 07:04:02.925000 0
第二次质询: -
sel * from scratch.fact_test order by proct_dt asc,dw_job_id asc其中dw_job_id = 10309
结果: -
dw_job_id proct_dt start_ts end_ts status
1 10,309 2018-03-06 00:00:00 2018-03-06 06:30:25 2018-03-06 06:30:42.759 12
2 10,309 2018-03-07 00:00:00 2018-03-07 06:35:36 2018-03-07 06:36:03.809 12
所以在第二个查询中我通过第一次出现proct_dt,start_ts,end_ts
从第一个表中得到了所需的结果如有任何澄清,请与我们联系 如果有人能帮助实现这一案例,那将是非常好的。
谢谢,
答案 0 :(得分:0)
目前还不清楚你的解释是什么,但看起来你想要每天第一次完成一份工作,这很容易使用Row_Number:
select *
from scratch.COGIPF_RUNREPORT_test1
where dw_job_id =10309
qualify
row_number()
over (partition by dw_job_id, proc_dt -- for each job & date
order by start_ts) = 1 -- only the 1st run