我有格式数据
1,1.2
2,1.3
and so on..
所以基本上这是id,val组合,其中id是唯一的......
我想计算所有值的平均值。
So here.. avg(1.2,1.3)
我正在通过文档,但大多数聚合函数涉及按一些id进行分组..然后使用AVG ...但由于id是唯一的..我该如何对它们进行分组? 所以基本上这个努力的结果将是一个浮动.. 任何建议将不胜感激。
由于
答案 0 :(得分:2)
GROUP X ALL
应解决您的问题:)
A = LOAD 'data' USING PigStorage(') AS (f1:int, f2:int);
B = GROUP A ALL;
AV = FOREACH B GENERATE AVG(A.f1);
DUMP AV;