PIG中多行到单个逗号分隔线

时间:2016-07-22 10:36:58

标签: hadoop apache-pig hadoop2

我已将单行转换为多行并应用了一些转换。现在我需要将每一行转换为单行

我尝试使用tupple但没有wrked,

D = foreach grouped generate  group, COUNT(R);
requestFile = foreach D generate (bag{tuple(chararray)}) D.group as abc:{(group:chararray)};
G = GROUP requestFile ALL;
F = FOREACH G generate requestFile;  

D有重复的单词和次数。

1 个答案:

答案 0 :(得分:0)

您应该使用BagToTuple的FLATTEN将多行转换为单行,如上面的代码所示,

D = FOREACH grouped generate  group, COUNT(R);
G = GROUP D ALL;
F = FOREACH G generate FLATTEN(BagToTuple(D)) ;