例如,我有一个这样的输入文件:
xxx,14
yyy,20
zzz,11
我希望SUM为第二个filds和输出。现在我知道如何使用Hadoop Pig来理解它,但我希望输出如下:
Canada,45
所以这意味着我自己将键名设置为“Canada”并添加SUM作为值。如何自己设置密钥名称?
答案 0 :(得分:2)
只需应用常量字段:
A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;