我有2个数据文件要加载到猪身上。
A = LOAD 'temp.csv' USING PigStorage(',') AS (user:chararray,day:chararray,joinKey:chararray);
B = LOAD 'new.csv' USING PigStorage(',') AS (user:chararray,day:chararray,joinKey:chararray);
c = join A by (joinKey),B by (joinKey);
d = FOREACH c GENERATE MAX(A:day,B:day) as maxDay
这不起作用,因为没有分组。 如何实现2列的最大值。 获得最大值后,我需要存储与最大日期字段相关的用户。