嗨,我是Hadoop和Pig的新手。 当我尝试使用猪中的ORDER BY对数据进行排序时,输出并不完全按升序排列。 输入:1,4,12,36,88,93,7 代码:
A = LOAD 'INPUT' using PigStorage();
B = ORDER A BY $0;`enter code here`
DUMP B;
产出:1,12,36,4,7,88,93 这不正确。请帮助我以正确的方式得到它。
答案 0 :(得分:1)
您需要将列$ 0声明为数字,或使用强制转换。例如:
A = LOAD 'INPUT' using PigStorage() AS (a0:int, [extra columns here]);
B = ORDER A BY a0;
DUMP B;
否则,它基本上被处理为字符串。