我正在使用pig进行数据分析。所以我想格式化我的输入文件:
column1a,column2a,column3a
column1b,column2b,column3b
column1c,column2c,column3c
column1d,column2d,column3d
我希望将此输入生成为输出:
column1a|column2a|column3a
column1b|column2b|column3b
column1c|column2c|column3c
column1d|column2d|column3d
如何生成这个。
答案 0 :(得分:0)
尝试使用此代码:
a = LOAD '<path>' using PigStorage(',') as (f1,f2,f3)
b = FOREACH a GENERATE CONCAT(f1,'|',f2,'|',f3);
dump b;