使用order by在Pig中排序

时间:2015-10-10 17:08:27

标签: sorting hadoop apache-pig

嗨,我是Hadoop和Pig的新手。 当我尝试使用猪中的ORDER BY对数据进行排序时,输出并不完全按升序排列。 输入:1,4,12,36,88,93,7 代码:

A = LOAD 'INPUT' using PigStorage();
B = ORDER A BY $0;`enter code here`
DUMP B;

产出:1,12,36,4,7,88,93 这不正确。请帮助我以正确的方式得到它。

1 个答案:

答案 0 :(得分:1)

您需要将列$ 0声明为数字,或使用强制转换。例如:

A = LOAD 'INPUT' using PigStorage() AS (a0:int, [extra columns here]);
B = ORDER A BY a0;
DUMP B;

否则,它基本上被处理为字符串。