标签: regex unix hadoop pattern-matching apache-pig
如何在pig中提取由|^分隔的字段。 样本数据:
|^
Jack|^USA|^BMW|^
我试过了myRegExLoader('(\\w)\\|^')
myRegExLoader('(\\w)\\|^')
但没有工作
答案 0 :(得分:0)
尝试以下方法:
testRel = LOAD 'data.txt' using PigStorage('|^') AS (name:chararray, country:chararray, organization:chararray)