Apache pig Store根据条件存储

时间:2017-02-18 15:59:22

标签: apache-pig

我正在读取csv文件,并在对这些数据进行分组后,我正在进行计数操作。有没有办法将数据存储到文件夹名称中,如果计数为0则为坏,如果计数为>则为好。 0。我尝试使用下面的代码,但它没有发生。

CODE : 

STORE countVal INTO '/user/cloudera/good' IF countVal > 0 ;

2 个答案:

答案 0 :(得分:0)

USE功能SPLIT。参考:

https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#SPLIT

SPLIT A INTO X IF f1<7, Y IF f2==5, Z IF (f3<6 OR f3>6);

答案 1 :(得分:0)

有几种方法:

1)使用split功能根据条件执行拆分。

如果计数&gt; 0,则将数据分成好,如果(count == 0);

,则为坏

2)使用FOREACH循环使用BinCond运算符根据条件分离数据。

X = FOREACH A GENERATE,数据,(计数&gt; 0?&#34;好&#34;:&#34;坏&#34;);