如何删除Pig中包含%的行?

时间:2014-03-26 07:35:35

标签: hdfs apache-pig

我的文件包含3ed列中的数据我想使用pig过滤该数据并对其执行其他操作。

字符串就像%D0%90%D0%BB%D0%B0 ,所有其他字符串都是similer但包含%char。

我如何过滤数据我正在做的是

Z = FILTER A BY not (a3  matches '.*%%D0%%*.'); 

2 个答案:

答案 0 :(得分:0)

首先,确保a3是Chararray。然后,您应该像这样过滤:

Z= FILTER A BY NOT a3 MATCHES '.*%D0%.*';

据我所知,没有必要转义%,如果你想过滤那些不包含%D0%的那些,你应该只放一个%。但是,如果要过滤那些不包含%% D0 %%的表达式,则表达式应该可以正常工作。

答案 1 :(得分:0)

这适用于我的情况:

 Z = FILTER A BY NOT a3 matches '.*.[%].*.';

通过使用此过滤器,我可以删除包含'%'

的行