如果假设我有员工关系,其架构就像姓名,年龄,地点,薪水,部门......现在我想根据列的不同值拆分这种关系。
就像在纽约工作的所有员工都处于一种关系中一样,在伦敦工作的所有员工都将处于一种关系中......等等。
答案 0 :(得分:0)
使用SPLIT。假设您的文件是Employee.txt,并且字段是制表符分隔的。
A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;