数据:
someId,+ 1 5552221234
someId2,+ 1 3331114321
我想从
下面的第二个字段中删除+1我首先加载数据 A = LOAD'Data'使用PigStroage(,)as(Id:chararray,电话:chararray)
现在我想拥有以下数据
期望输出:
someId,5552221234
someId2,3331114321
我将如何做到这一点。我使用以下内容但它不起作用:
mss_demographic_data3 = FOREACH mss_demographic_data2 GENERATE *,REGEX_EXTRACT_ALL(电话,'[0-9] {9} $')为newPhone;
答案 0 :(得分:0)
使用子字符串函数。 (最简单的方式)
mss_demographic_data3= FOREACH mss_demographic_data2 GENERATE Id,SUBSTRING(Phone,3,12);
注意 - 只有在使用猪0.8.0或以上时才有此(子串函数)。如果你使用旧版本的猪,你可能需要写一个udf。