查找关系中原子长度的猪脚本是什么
说下面是我的输入文件
ABCD,10
ABC,20
myinput = LOAD'file'AS(str:chararray,num:int);
size = FOREACH myinput GENERATE str,LENGTH(str)as my_length,num;
dump size;
上面的脚本会抛出一些错误
我所需要的就是找到原子的长度。
有人可以提供帮助
答案 0 :(得分:1)
更改
myinput = LOAD 'file' AS(str:chararray,num:int);
到
myinput = LOAD '/root/stack/data/atom' using PigStorage(',') as (str:chararray,num:int);
原因:默认加载功能需要' tab'作为分隔符。
和
sized = FOREACH myinput GENERATE str, LENGTH(str) as my_length ,num;
到
sized = FOREACH myinput GENERATE str, SIZE(str) as my_length ,num;