如何删除猪的重复列?

时间:2015-06-29 05:50:03

标签: apache-pig

我有一张员工表

eid | ename  | deptno
---------------------
1   | ABC    | 10
2   | XYZ    | 20 
3   | PQR    | 10 
4   | BCD    | 20 
5   | CBA    | 10

当我尝试使用deptno进行分组时,它会显示第二列中的deptno以及。我如何避免它?

1 个答案:

答案 0 :(得分:0)

分组后,您必须遍历元素(使用FOREACH)并使用GENERATE投影数据以选择您感兴趣的列。 喜欢:

res = FOREACH ( GROUP input BY deptno ) {
    GENERATE eid, ename
        , deptno -- you may remove that line if you do not need deptno anymore
    ;
}