按链接ID分组

时间:2016-01-27 03:51:31

标签: group-by hive aggregation self-join

我在hive表中有一些项目。项目的ID经常更改。我有一个表来管理这些更改。表格的列如下所示:

Old_Item_ID, 
New_Item_ID,
Change_Timestamp

如何从此配置单元表中找到每个项目的最旧项目ID,最新项目ID和最新更改时间戳。

样本I / P数据:

X01, X25, 2014/01/01 00:00
X02, X42, 2000/05/25 00:00
X69, X92, 2015/01/23 00:00
X25, X69, 2014/06/20 00:00

样本O / P:

X01, X92, 2015/01/23 00:00
X02, X42, 2000/05/25 00:00

注意: HIVE不支持递归CTE。

0 个答案:

没有答案