如何在Pig中对输入数据行进行分组,保留顺序?

时间:2013-12-30 02:25:40

标签: apache-pig

我输入了有序(排名)的数据行,例如

 1,23
 1,45
 1,12
 2,74
 2,11
 2,8`

并且基本上希望将它们分组在col1上,但保留col2的顺序:

{1,{(23,45,12)}}
{2,{(74,11,8)}}

标准GROUP是(imho)不是内袋的选择 {1,{(1,23),(1,45),(1,12))}}不保证23,45,12保持该顺序。

1 个答案:

答案 0 :(得分:2)

您可以使用RANK为每一行添加行号,然后在您按顺序对内部组进行排序后。

A = load 'data' AS (f1:int,f2:int);
B = RANK A;