如何根据猪的不同列的值来分割关系

时间:2016-08-26 19:28:04

标签: hadoop relational-database apache-pig bigdata

如果假设我有员工关系,其架构就像姓名,年龄,地点,薪水,部门......现在我想根据列的不同值拆分这种关系。

就像在纽约工作的所有员工都处于一种关系中一样,在伦敦工作的所有员工都将处于一种关系中......等等。

1 个答案:

答案 0 :(得分:0)

使用SPLIT。假设您的文件是Employee.txt,并且字段是制表符分隔的。

A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;