在PIG中提取字符串的一部分

时间:2017-02-08 05:20:06

标签: apache-pig

我需要提取'之后的部分字符串 - '字符串的一部分。

让我们说,

  

LONGNAME Andrew-stellar Alex-COOK

预期产出:

  

COOK恒星

我尝试过:

REGEX_EXTRACT(LONGNAME,'(-.*)',1) as shortname

但它给出了:

  

-COOK   -Stellar

如何删除' - '?

1 个答案:

答案 0 :(得分:0)

尝试添加REPLACE功能:

A = LOAD 'data' USING PigStorage() AS (longname:chararray);

B = FOREACH A GENERATE REPLACE(REGEX_EXTRACT(longname,'(-.*)',1),'-','') as shortname;

DUMP B;

输出:

  

(恒星)(COOK)