如何从猪的地图中检索最大值

时间:2014-09-09 05:54:08

标签: hadoop map apache-pig

我有一种关系。描述书籍 - > {地图[]}。

这里有一对,关键是Ashok LeyLand,价值是Ashok 0.15

Ashok LeyLand#Ashok 0.15.
Ashok LeyLand#Land 0.012.
Ashok LeyLand#Ley 0.002.
Ashok LeyLand#Ashoka 0.09.
Hero Cycles Limited#Hero Cycles 0.72
Hero Cycles Limited#Hero 0.06
Hero Cycles Limited#Hero Limited 0.54
Hero Cycles Limited#Cycles 0.01

我希望这对价值最高。需要输出为Ashok LeyLand #Ashok 0.15。 如果有可能获得所需的输出,我可以修改下面的关系。

这里有一对,关键是Ashok LeyLand Ashok的值是0.15

Ashok LeyLand Ashok#0.15.
Ashok LeyLand Land#0.012.
Ashok LeyLand Ley#0.002.
Ashok LeyLand Ashoka#0.09.
Hero Cycles Limited Hero Cycles#0.72
Hero Cycles Limited Hero#0.06
Hero Cycles Limited Hero Limited#0.54
Hero Cycles Limited Cycles#0.01

由于

1 个答案:

答案 0 :(得分:1)

我使用MapToBag UDF将地图转换为包。使用GROUP按所需键分组行。使用Top函数过滤最高值而不是使用ORDER BY AND LIMIT。