使用pig查找pig表中每列中存在的所有数据的最大值

时间:2017-05-05 17:52:08

标签: hadoop apache-pig bigdata

输入格式:

Year_2010 , Year_2009, Year_2008

1.2, 2.4, 3.5
3.4, 3.8, 5.7
4.5, 5.6, 3.4
3.7, 2.6, 4.8

我尝试了以下脚本,它适用于1列。

A = Load '/Year.csv' Using PigStorage(',') as (Year_2010:double,Year_2009:double,Year_2008:double); 
B = group A ALL; 
max = Foreach B generate group,MAX(A.Year_2010); 

预期产出:

Year_2010, Year_2009, Year_2008

4.5, 5.6, 5.7

1 个答案:

答案 0 :(得分:0)

在列上应用MAX之前,先查看MAX。GROUP。

A = Load '/Year.csv' Using PigStorage(',') as (Year_2010:double,Year_2009:double,Year_2008:double); 
B = GROUP A ALL;
C = FOREACH B GENERATE MAX(A.Year_2010),MAX(A.Year_2009),MAX(A.Year_2008);
DUMP C;

<强>输出:

enter image description here