是否有可能在猪中找到三重数据集?假设您的数据是:
bag1 Apple
bag1 Orange
bag2 Apple
bag2 Orange
bag2 Pineapple
bag3 Apple
bag3 Orange
bag3 Pineapple
bag4 Orange
bag5 Apple
bag5 Banana
在上面的数据中,我想计算每个包内设置的(Apple,Orange,Pineapple)的出现次数,这对bag2和bag3来说是两次。这可能吗?
答案 0 :(得分:1)
A = LOAD' BAG.csv'使用PigStorage('')作为(包:Chararray,水果:Chararray);
B = A组$ 0;
C =按计数过滤B(A)== 3;
D = FOREACH C GENERATE组,A。$ 1为FRUITS;
DUMP D;