根据单词过滤字符串

时间:2011-09-16 13:58:57

标签: hadoop apache-pig

我有一份猪工作,我需要通过在其中找到一个单词来过滤数据,

这是片段

A = LOAD '/home/user/filename' USING PigStorage(',');
B = FOREACH A GENERATE $27,$38;
C = FILTER B BY ( $1 ==  '*Word*');
STORE C INTO '/home/user/out1' USING PigStorage();

找到C时错误在第3行, 我也尝试过使用

C = FILTER B BY $1 MATCHES '*WORD*'  

另外

C = FILTER B BY $1 MATCHES '\\w+WORD\\w+'  

1 个答案:

答案 0 :(得分:15)

MATCHES使用正则表达式。你应该改为... MATCHES '.*WORD.*'

这是here找到“apache”一词的示例。