我们有两个数据集: 学生:此数据集包含班级中学生的姓名和卷数 结果:此数据集包含学生的卷号和结果(失败或通过)
编写Pig脚本来分析给定的数据集并打印已成功通过考试的学生姓名。
答案 0 :(得分:0)
输入1- result.dat文件(id,status)
输入2- student.dat文件(名称,id)
re = load 'results.dat' as (id:int,status:chararray);
st = load 'student.dat' as (name:chararray,id:int);
join_re_st = join re by $0,st by $1;
fil = filter join_re_st by $1 != 'fail';
result = foreach fil generate $0,$1,$2;
Dump result;