我正在尝试识别重复的数据组,并且一直认为这听起来很简单。对不起,我也为Hive论坛发布了同样的问题。但试图进入PIG。
以下是我的数据集。
ID, TIME, Speed
1, 10, 0
1, 11, 0
1, 12, 0
1, 12, 1
1, 13, 2
1, 14, 0
1, 15, 0
1, 16, 4
我正在努力实现重复零速度的最小值和最大值。在这个案例中
ID, Min, Max, Value
1 , 10 , 12, 0
1, 14, 15, 0
我已经尝试过Lead / Lag功能,但我能够获得每一行。但不是零组。我想在PIG中得到这个
任何帮助都会受到极大的赞赏。