过滤器无法正常工作

时间:2014-02-24 11:37:55

标签: apache-pig biginsights

我们正在尝试使用Pig查询过滤hdfs数据。我们将数据括在双引号内.Eg:“AAA”,“BBB”,“YYY”。我们在其中尝试过滤YYY 我们尝试了以下过滤方法,

FILTER a BY XXX == 'YYY';
FILTER a BY XXX == '.*YYY.*';
FILTER a BY XXX == '\'\YYY\"\';

期待着你的帮助。

1 个答案:

答案 0 :(得分:2)

看起来您正在尝试使用正则表达式。在这种情况下,你有一些问题。您需要使用MATCHES而不是==,您必须匹配整个字符串,而不仅仅是子字符串,并且在使用元字符时,您必须转义反斜杠,就像使用任何Java字符串一样:{{ 1}}匹配一个数字,而不是\\d