Java程序,用于解析使用Pig脚本生成的组的输出

时间:2014-01-17 05:45:15

标签: java hadoop apache-pig

我需要使用Java解析以下行,这是由Pig组函数生成的。

(D1,{(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2)})

此处D1是键,(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2)是相应的值。

我正在寻找一个只保留值的java pgm。但是,','的分割函数不能直接应用,因为内部元素也包含分隔符。

1 个答案:

答案 0 :(得分:1)

糟糕的DIY解决方案是首先隔离"(A1,null,C1,D1,E1),(null,B1,C1,D1,E1),(A2,null,null,D1,E2)",然后将其拆分为"),(",以便您拥有"(A1,null,C1,D1,E1""null,B1,C1,D1,E1""A2,null,null,D1,E2)"。删除多余的括号,然后根据需要用逗号分隔。