有没有办法找到关系中可用的字段数或列数?
例如:
a = load 'input' using PigStorage(',') as (a1,a2,a3);
b = load 'input2' using PigStorage(',') as (b1,b2,b3);
C = join a by a1, b by b1;
现在结果'c'中将有六列。有没有办法按代码检查结果中的列数。
谢谢,
卡莱
答案 0 :(得分:2)
PIG没有提供任何有意计算列的方法,但是使用pig中字段数的一种方法是先存储文件,然后计算文件中的分隔符号。
示例: - (使用的分隔符是“|”)
%声明COUNT hadoop fs -cat //trihadn01/user/ykale/warranty_recs | head -1| tr '|' '\n'|wc -l
;
然后使用此变量 - 在猪中需要的COUNT。
注意 - 请不要错过语句末尾和变量名称(计数)之后的“`”符号