如何从Pig Script中的分组数据的列中的列表中获取一个值

时间:2016-03-07 04:23:46

标签: apache-pig

我使用Pig Script获取数据 -

GENERATE COUNT(C)为kount,group.methodName,group.pool,MIN(C.time),MAX(C.time), C.FlowId };

这里的FlowId(字母数字)是一个包含多个id的列表,对应于不同的方法名称,但我只需要一个id,它可以是列表中的任何一个。 如何使用Pig Script实现此目的? 那么,基本上在上面的查询中如何获得单个流ID而不是流ID列表?

任何指针都会受到赞赏..

我尝试了MAX for Flow ID,但由于Flow ID是字母数字,我无法工作。

1 个答案:

答案 0 :(得分:0)

使用 -

解决了这个问题

E = FOREACH D {sorted = order C by time desc; top = limit排序1;生成COUNT(C)为kount,flatten(top),MIN(C.time); };

展平顶部将具有基于时间的最新流量ID