猪数据总和

时间:2015-10-10 11:47:34

标签: sum apache-pig

我有一个像 - 的文件 (1950,10) (1951,33) (1952,15) (1953,17) (1954,17) (1955,14) (1956,60) (1957,98) (1958,73) (1959,87) (1960,123)

我希望通过Pig得到第二个字段的总和。 例如out out应该是这样的 (547)

请帮忙

1 个答案:

答案 0 :(得分:1)

你可以这样做。你必须将所有记录分组..

DEFC = ','

答案:

 x = LOAD '/root/stack.txt' USING PigStorage(',') as (year:int,score:int);
 y = GROUP x ALL;
 z = FOREACH y GENERATE SUM(x.score);
 dump z;

这是否解决了你的问题......