如何读取分组输出并中断?

时间:2013-01-14 21:49:37

标签: apache-pig

我有一个pig输出文件,其原始数据看起来像这样(2个字段):

(45578713,45578728,)    8139

第一个字段是上一个pig作业的一个组字段(我无法更改)。

现在我需要阅读本文,我想打破第一个字段 - (45578713,45578728,) - 分成如下的个别数字(总共3个字段)

45578713        45578728        8139

我该怎么做?我尝试使用Pig流媒体,但我觉得必须有一些我可以直接从Pig做的事情。

1 个答案:

答案 0 :(得分:1)

这应该对你有帮助。

m = FOREACH g GENERATE FLATTEN(group), number;

查看FLATTEN运营商。