我有一个像 - 的文件 (1950,10) (1951,33) (1952,15) (1953,17) (1954,17) (1955,14) (1956,60) (1957,98) (1958,73) (1959,87) (1960,123)
我希望通过Pig得到第二个字段的总和。 例如out out应该是这样的 (547)
请帮忙
答案 0 :(得分:1)
你可以这样做。你必须将所有记录分组..
DEFC = ','
答案:
x = LOAD '/root/stack.txt' USING PigStorage(',') as (year:int,score:int);
y = GROUP x ALL;
z = FOREACH y GENERATE SUM(x.score);
dump z;
这是否解决了你的问题......