在Pig Latin中使用TOBAG和STRSPLIT

时间:2013-10-25 03:09:43

标签: hadoop mapreduce hdfs apache-pig

我有一个包含以下内容的文件

1,2,3|4,5,6

第一个分隔符是'|'下一个分隔符是','。

我希望我的输出以下列格式出现

1
2
3
4
5
6

你知道任何猪拉丁文字可供选择。

谢谢,

此致 Dheeraj Rampally。

1 个答案:

答案 0 :(得分:1)

没关系。我得到了答案。

A = load 'abc.txt';
B = foreach A generate FLATTEN(STRSPLIT($0,'\\|'));
C = foreach B generate FLATTEN(TOBAG(*));
store C into 'def';

A1 = load 'def';    
B1 = foreach A1 generate FLATTEN(STRSPLIT($0,'\\,'));    
C1 = foreach B1 generate FLATTEN(TOBAG(*));   
store C1 into 'ghi';

给了我解决方案。

谢谢,

此致 Dheeraj Rampally。