我正在使用PIG LATIN分析之前的T20 WORLD CUP比赛。因此,每个匹配都在一个单独的CSV文件中。而且我想找到所有玩家制作的100个总数。
我的方法:我使用这个脚本加载每个文件:
t20 = LOAD '/home/ankur/Desktop/Pig_Scripts/t20_csv' USING PigStorage(',') as (inning,overs,team,stk,nstk,bowler,run,extra,type,name);
但是使用这种方法,每个文件的数据都会进入同一个包,这就是为什么我找不到100的数据的原因。
我的方式是否正确?如果你有其他想法,建议我。
答案 0 :(得分:0)
计算已过滤的记录
t20 = LOAD '/home/ankur/Desktop/Pig_Scripts/*' USING PigStorage(',') as (inning,overs,team,stk,nstk,bowler,run,extra,type,name);
hundred_records = FILTER t20 BY (run > 99);
total_hundreds = FOREACH hundred_records GENERATE COUNT(hundred_records);