在PIG中提取由“| ^”分隔的记录

时间:2014-02-27 01:17:39

标签: regex unix hadoop pattern-matching apache-pig

如何在中提取由|^分隔的字段。 样本数据:

Jack|^USA|^BMW|^

我试过了myRegExLoader('(\\w)\\|^')

但没有工作

1 个答案:

答案 0 :(得分:0)

尝试以下方法:

testRel = LOAD 'data.txt' using PigStorage('|^') AS (name:chararray, country:chararray, organization:chararray)