我有一个有数百列的csv文件,当我将文件加载到Pig时,我不想像每个列一样分配
A = load 'path/to/file' as (a,b,c,d,e......)
因为我会在第二步过滤掉很多:
B = foreach A generate $0,$2,....;
但是在这里,我可以为B的每一列分配名称和类型吗?
之类的东西B = foreach A generate $0,$2,... AS (a:int,b:int,c:float)
我尝试了上面的代码,但它不起作用。
感谢。
答案 0 :(得分:4)
您必须在每个逗号之间指定它们。
B = foreach A generate $0 as a, $2 as b,...
请注意,它只是假设它已经是类型。