如何从列中的字符串列表中提取特定单词

时间:2019-02-06 05:32:30

标签: apache-pig

我表中的数据如下。

Archer late
Patrick late
Marie Walter late
Michael-d'souza late

我想用猪从列表中删除吗?我可以使用regex删除单词吗?有人可以帮我解决这个问题吗?

编辑:

我使用了以下命令,但失败了:

EXTRACT(姓氏,'(\ b [Dd] + [Ee] + [Cc] + [Ee] + [Aa] + [Ss] + [Ee] + [Dd] + \ b)'))< / p>

1 个答案:

答案 0 :(得分:0)

如何致电REPLACE?

A = LOAD 'input.txt' AS (a0:chararray);
B = FOREACH A GENERATE REPLACE(a0, 'late','');
dump B;