Pig Nested Group By

时间:2015-08-21 03:34:03

标签: apache-pig

我正在尝试识别重复的数据组,并且一直认为这听起来很简单。对不起,我也为Hive论坛发布了同样的问题。但试图进入PIG。

以下是我的数据集。 ID, TIME, Speed 1, 10, 0 1, 11, 0 1, 12, 0 1, 12, 1 1, 13, 2 1, 14, 0 1, 15, 0 1, 16, 4

我正在努力实现重复零速度的最小值和最大值。在这个案例中

ID, Min, Max, Value 1 , 10 , 12, 0 1, 14, 15, 0 我已经尝试过Lead / Lag功能,但我能够获得每一行。但不是零组。我想在PIG中得到这个

任何帮助都会受到极大的赞赏。

0 个答案:

没有答案