我在hive数据库中有一个包含3列的表:
用户 日期 刷新时间
我想查询用户的max(date)和max(refresh_time)以获得第一步的max(date)。我可以通过几个步骤(通过创建额外的表)来完成此操作,但是我希望有一个查询。正确的方法怎么做?
答案 0 :(得分:0)
使用窗口功能:
select t.*
from (select t.*,
row_number() over (partition by user order by date desc, refresh_time desc) as seqnum
from t
) t
where seqnum = 1;