解析PIG袋和元组

时间:2014-07-15 09:56:37

标签: hadoop apache-pig

Pig Code

describe b ;   

b: {key: int,columns: {T: (alpha: chararray)}}

dump b ;

(3032,{({(name),(john),(1405416697822000)})})

(3031,{({(address),(bangalore),(1405416684062000)}),({(name),(Michael),(1405416690767000)})})

现在我想处理这些数据并输出:

        name       address

3031    John       <null>

3032    Michael    bangalore

请指导如何进行?我是PIG的新手。

提前致谢!!!!

1 个答案:

答案 0 :(得分:0)

您可以在包含列的元组上使用BagToString,并使用正则表达式来确定它是名称还是地址