这里我的“test.csv”文件中有一行代码如下:
1987654,档案未上传,请再试一次,约翰逊
我想使用Pig
获得如下输出 任务ID
1987654
消息
文件未上传,请重试
用户
约翰逊
答案 0 :(得分:1)
由于所有行都具有相同的格式,因此简单的解决方案是将其加载到4个字段中,并使用逗号作为分隔符,然后使用CONCAT将逗号连接到第2和第3个字段。
A = LOAD 'data.txt' USING PigStorage(',') AS (a1:int,a2:chararray,a3:chararray,a4:chararray);
B = FOREACH A GENERATE a1,CONCAT(CONCAT(a2,','),a3),a4;
DUMP B;