我正在使用Redshift并希望通过userid接收最后一个非Null值。
以下是一个示例数据集:
Date UserID Value
4-18-2018 abc 1
4-19-2018 abc NULL
4-20-2018 abc NULL
4-21-2018 abc 8
4-19-2018 def 9
4-20-2018 def 10
4-21-2018 def NULL
4-22-2018 tey NULL
4-23-2018 tey 2
如果新用户以NULL开头,则替换为0.
我希望我的最终数据集看起来像这样:
Date UserID Value
4-18-2018 abc 1
4-19-2018 abc 1
4-20-2018 abc 1
4-21-2018 abc 8
4-19-2018 def 9
4-20-2018 def 10
4-21-2018 def 10
4-22-2018 tey 1
4-23-2018 tey 2
任何帮助都会非常感谢!
答案 0 :(得分:1)
您可以使用lag()
和ignore nulls
选项执行此操作:
select date, userid,
coalesce(value, lag(value ignore nulls) over (partition by userid order by date)) as value
from t;
如果值增加,您还可以使用累计最大值:
select date, userid,
max(value) over (partition by userid order by date) as value
from t;