寻找猪的原子长度

时间:2014-07-21 09:22:57

标签: apache-pig

查找关系中原子长度的猪脚本是什么

说下面是我的输入文件

ABCD,10

ABC,20

myinput = LOAD'file'AS(str:chararray,num:int);

size = FOREACH myinput GENERATE str,LENGTH(str)as my_length,num;

dump size;

上面的脚本会抛出一些错误

我所需要的就是找到原子的长度。

有人可以提供帮助

1 个答案:

答案 0 :(得分:1)

更改

myinput = LOAD 'file' AS(str:chararray,num:int); 

myinput = LOAD '/root/stack/data/atom' using PigStorage(',') as (str:chararray,num:int);

原因:默认加载功能需要' tab'作为分隔符。

sized = FOREACH myinput GENERATE str, LENGTH(str) as my_length ,num; 

 sized = FOREACH myinput GENERATE str, SIZE(str) as my_length ,num;