pig脚本有条件地打印数据集

时间:2016-06-26 11:26:19

标签: apache-pig

我们有两个数据集: 学生:此数据集包含班级中学生的姓名和卷数 结果:此数据集包含学生的卷号和结果(失败或通过)

编写Pig脚本来分析给定的数据集并打印已成功通过考试的学生姓名。

1 个答案:

答案 0 :(得分:0)

输入1- result.dat文件(id,status)
输入2- student.dat文件(名称,id)

re = load 'results.dat' as (id:int,status:chararray); 

st = load 'student.dat' as (name:chararray,id:int); 

join_re_st = join re by $0,st by $1; 

fil = filter join_re_st by $1 != 'fail'; 

result = foreach fil generate $0,$1,$2; 

Dump result;