标签: apache-pig
我有一个pig输出文件,其原始数据看起来像这样(2个字段):
(45578713,45578728,) 8139
第一个字段是上一个pig作业的一个组字段(我无法更改)。
现在我需要阅读本文,我想打破第一个字段 - (45578713,45578728,) - 分成如下的个别数字(总共3个字段)
45578713 45578728 8139
我该怎么做?我尝试使用Pig流媒体,但我觉得必须有一些我可以直接从Pig做的事情。
答案 0 :(得分:1)
这应该对你有帮助。
m = FOREACH g GENERATE FLATTEN(group), number;
查看FLATTEN运营商。
FLATTEN