Piggybank功能可以获得每组中最大的计数

时间:2015-03-26 21:57:04

标签: database hadoop apache-pig

我有格式

的数据
{group: chararray,finalItemsets: {(trans::sale::productId: int,product::serveRegion: chararray)}}; 

我希望产品在每个组中具有最大数量,即我正在尝试获取

中的productId
{(trans::sale::productId: int,product::serveRegion: chararray)}

在每组中重复最多次数。

最终输出结构可能如下所示 - group, productId, maxCount(productId)。那么,皮卡中是否有任何UDF让我这样做。

希望尽快收到你的回复!

0 个答案:

没有答案