如果行包含多个相同的分隔符,如何正确使用Pig脚本?

时间:2017-02-07 18:25:40

标签: apache-pig

这里我的“test.csv”文件中有一行代码如下:

1987654,档案未上传,请再试一次,约翰逊

我想使用Pig

获得如下输出

任务ID
 1987654

消息

文件未上传,请重试

用户

约翰逊

1 个答案:

答案 0 :(得分:1)

由于所有行都具有相同的格式,因此简单的解决方案是将其加载到4个字段中,并使用逗号作为分隔符,然后使用CONCAT将逗号连接到第2和第3个字段。

A = LOAD 'data.txt' USING PigStorage(',') AS (a1:int,a2:chararray,a3:chararray,a4:chararray);
B = FOREACH A GENERATE a1,CONCAT(CONCAT(a2,','),a3),a4;
DUMP B;