我不确定这在SQL中是否可行。我的表中有两个字段“ a”和“ b”。当行具有相同的“ a”值或相同的“ b”值时,我想对表中的记录进行分组,然后提取具有最新时间戳的另一个字段的值。这可能吗?我正在使用Redshift。
这是一个示例表:
|| key1 || key2 || date || value ||
| 1 | 'a' | '2019-01-01' | 'john' |
| 1 | 'b' | '2019-01-03' | 'ben' |
| 2 | 'c' | '2019-02-01' | 'kim' |
| 3 | 'c' | '2019-02-02' | 'dan' |
| 4 | 'd' | '2019-02-03' | 'jan' |
最终我想要拥有的是:
| 'ben' |
| 'dan' |
| 'jan' |
提前谢谢!
答案 0 :(得分:1)
您可以尝试通过ROW_NUMBER
和SUM
窗口函数为这两个键编写结果集。
然后从组中获得rn = 1
的最新行。
查询1 :
SELECT value
FROM (
SELECT value,
sum(1) OVER(PARTITION BY key1 ORDER BY key1) cnt1,
sum(1) OVER(PARTITION BY key2 ORDER BY key2) cnt2 ,
ROW_NUMBER () OVER(PARTITION BY key1 ORDER BY date DESC) rn1,
ROW_NUMBER () OVER(PARTITION BY key2 ORDER BY date DESC) rn2
FROM T
) t1
WHERE
(rn1 = 1 and cnt1 > 1)
or
(rn2 = 1 and cnt2 > 1)
or
(cnt1 = 1 and cnt2 = 1)
Results :
| value |
|-------|
| ben |
| dan |
| jan |
答案 1 :(得分:0)
假设:所有记录的日期值都是唯一的。
我想到了这个
select mytable.value1
from (select key1, max(date1) max_date1 from mytable group by key1) q1
inner join (select key2, max(date1) max_date1 from mytable group by key2) q2
on q2.max_date1 = q1.max_date1
inner join mytable on mytable.date1 = q1.max_date1
基于此架构:
create table myTable (
key1 int,
key2 nvarchar(1),
date1 date,
value1 nvarchar(20)
);
insert into mytable values
(1, 'a', '2019-01-01', 'john'),
(1, 'b', '2019-01-03', 'ben'),
(2, 'c', '2019-02-01', 'kim'),
(3, 'c', '2019-02-02', 'dan');