如何从Pig中的字段中删除字符

时间:2014-03-06 19:20:22

标签: apache-pig

数据:

  

someId,+ 1 5552221234
  someId2,+ 1 3331114321

我想从

下面的第二个字段中删除+1

我首先加载数据 A = LOAD'Data'使用PigStroage(,)as(Id:chararray,电话:chararray)

现在我想拥有以下数据

期望输出:

  

someId,5552221234
  someId2,3331114321

我将如何做到这一点。我使用以下内容但它不起作用:

mss_demographic_data3 = FOREACH mss_demographic_data2 GENERATE *,REGEX_EXTRACT_ALL(电话,'[0-9] {9} $')为newPhone;

1 个答案:

答案 0 :(得分:0)

使用子字符串函数。 (最简单的方式

mss_demographic_data3= FOREACH mss_demographic_data2 GENERATE Id,SUBSTRING(Phone,3,12);

注意 - 只有在使用猪0.8.0或以上时才有此(子串函数)。如果你使用旧版本的猪,你可能需要写一个udf。