我使用Pig Script获取数据 -
GENERATE COUNT(C)为kount,group.methodName,group.pool,MIN(C.time),MAX(C.time), C.FlowId };
这里的FlowId(字母数字)是一个包含多个id的列表,对应于不同的方法名称,但我只需要一个id,它可以是列表中的任何一个。 如何使用Pig Script实现此目的? 那么,基本上在上面的查询中如何获得单个流ID而不是流ID列表?
任何指针都会受到赞赏..
我尝试了MAX for Flow ID,但由于Flow ID是字母数字,我无法工作。
答案 0 :(得分:0)
使用 -
解决了这个问题E = FOREACH D {sorted = order C by time desc; top = limit排序1;生成COUNT(C)为kount,flatten(top),MIN(C.time); };
展平顶部将具有基于时间的最新流量ID