Hadoop Pig自定义密钥名称

时间:2013-08-08 20:07:42

标签: hadoop apache-pig

例如,我有一个这样的输入文件:

xxx,14
yyy,20
zzz,11

我希望SUM为第二个filds和输出。现在我知道如何使用Hadoop Pig来理解它,但我希望输出如下:

Canada,45

所以这意味着我自己将键名设置为“Canada”并添加SUM作为值。如何自己设置密钥名称?

1 个答案:

答案 0 :(得分:2)

只需应用常量字段:

A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;