将行值与列组合

时间:2013-11-20 09:03:47

标签: hadoop apache-pig

我有这样的数据

DUMP A;
(2013-11, a)
(2013-11, b)
(2013-11, c)
(2013-11, d)
(2013-12, e)

我想将行与相同的键合并为这样(我想要的输出):

(2013-11, a, b, c, d)
(2013-12, e)

如何单独使用Pig Latin来实现这一目标?

1 个答案:

答案 0 :(得分:1)

您正在寻找的是GROUP运营商。您可以像使用它一样使用它:

-- A is your sample.

B = GROUP A BY $0 ;
DUMP B ;
-- (2013-11, {(a), (b), (c), (d)})
-- (2013-12, {(e)}

请注意,无法保证行李将按字母(或任何)顺序排列。