猪一排到多​​排

时间:2014-06-26 06:46:45

标签: apache-pig

请为以下查询提供Pig脚本吗?

这是输入格式。 的输入

ID, Label  
122,a|b
215,q|b|c
214,Z|b|c
218,w|b|c
211,r|b|c
219,u|b

预期输出

122,a    
122,b
215,q
215,b
215,c
214,Z
214,b
214,c
218,w
218,b
218,c

...........

谢谢,

ABHI

1 个答案:

答案 0 :(得分:1)

TOKENIZE标签,它会给一个袋子而不是FLATTEN它,它会给你和袋子里的元组一样多的行。示例代码

inpt = LOAD '....' USING PigStorage(',') AS (ID: chararray, Label : chararray);
result = FOREACH inpt GENERATE ID, FLATTEN(TOKENIZE(Lable, '|'));

DUMP result;