在Apache Pig Latin中转置数据

时间:2011-08-20 00:36:30

标签: hadoop apache-pig

我需要“转置”看起来像这样的数据:

id      City   
111     Chicago  
111     New York  
111     LA  
222     Paris  
222     London
222     Tokyo

为:

111    Chicago    New York    LA
222    Paris      London      Tokyo

每个id每个都有三个条目,因此生成的关系将有4个字段。我试图避免使用UDF。有任何想法吗?

1 个答案:

答案 0 :(得分:3)

这不是基本的分组吗?

B = GROUP A BY id

检查http://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#GROUP