我正在寻找一种从Hive中的集合中选择最新项目(日期)的方法。例如,a有下表t1
:
item date
a 2016-01-01
a 2016-02-04
b 2016-01-10
后
hive> select item, collect_set(date) as dates from t1 group by item;
我有
item dates
a [2016-01-01, 2016-02-04]
b [2016-01-10]
所以现在我需要摆脱过时的日期,即创建像
这样的表格item date
a 2016-02-04
b 2016-01-10
有人可以帮忙吗?
答案 0 :(得分:0)
只需使用max()
:
select item, max(date) as date
from t1
group by item;
如果您确实想要新表,可以使用create table as
。