A是带有原始数据的包,我对它们进行了排名。
A = LOAD '$input' USING PigStorage(',');
RA = rank A;
需要从RA中排除$ 3并将结果存储到hdfs中。
这可以在装载时自行完成,但我需要它们作为2袋。 原始数据和Temprorary数据(从原始数据中扣除3美元后)。
答案 0 :(得分:2)
排名后,尝试这个:
A1 = FOREACH RA GENERATE $0, $1, $2, $4 .. ;
A2 = FOREACH RA GENERATE $3;