apache猪中的正则表达提取物

时间:2015-02-26 14:53:03

标签: apache-pig

我有像

这样的数据
A8
SS4
M9

我需要使用

从这些数据中提取所有字母
REGEX_EXTRACT

我的猪声明如下

A = load 'data';
B = foreach A generate REGEX_EXTRACT($0,'\\*[^0-9]',1);
dump B;

但是我输出为null。

1 个答案:

答案 0 :(得分:0)

你能试试吗?

<强>选项1:

A = load 'input' AS (line:chararray);
B = FOREACH A GENERATE REGEX_EXTRACT(line,'(.*[^0-9])',1);
DUMP B;

<强>选项2:

A = load 'input' AS (line:chararray);
B = FOREACH A GENERATE REGEX_EXTRACT(line,'(^[A-Za-z]+).*',1);
DUMP B;