我正在读取csv文件,并在对这些数据进行分组后,我正在进行计数操作。有没有办法将数据存储到文件夹名称中,如果计数为0则为坏,如果计数为>则为好。 0。我尝试使用下面的代码,但它没有发生。
CODE :
STORE countVal INTO '/user/cloudera/good' IF countVal > 0 ;
答案 0 :(得分:0)
USE功能SPLIT。参考:
https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#SPLIT
SPLIT A INTO X IF f1<7, Y IF f2==5, Z IF (f3<6 OR f3>6);
答案 1 :(得分:0)
有几种方法:
1)使用split功能根据条件执行拆分。
如果计数&gt; 0,则将数据分成好,如果(count == 0);
,则为坏2)使用FOREACH循环使用BinCond运算符根据条件分离数据。
X = FOREACH A GENERATE,数据,(计数&gt; 0?&#34;好&#34;:&#34;坏&#34;);