Hive:从集合中选择最新项目

时间:2016-03-16 11:29:13

标签: hadoop hive hiveql

我正在寻找一种从Hive中的集合中选择最新项目(日期)的方法。例如,a有下表t1

item       date
a          2016-01-01
a          2016-02-04
b          2016-01-10

hive> select item, collect_set(date) as dates from t1 group by item;

我有

item       dates
a          [2016-01-01, 2016-02-04]
b          [2016-01-10]

所以现在我需要摆脱过时的日期,即创建像

这样的表格
item       date
a          2016-02-04
b          2016-01-10

有人可以帮忙吗?

1 个答案:

答案 0 :(得分:0)

只需使用max()

select item, max(date) as date
from t1
group by item;

如果您确实想要新表,可以使用create table as