我有格式
的数据{group: chararray,finalItemsets: {(trans::sale::productId: int,product::serveRegion: chararray)}};
我希望产品在每个组中具有最大数量,即我正在尝试获取
中的productId{(trans::sale::productId: int,product::serveRegion: chararray)}
在每组中重复最多次数。
最终输出结构可能如下所示 - group, productId, maxCount(productId)
。那么,皮卡中是否有任何UDF让我这样做。
希望尽快收到你的回复!