如何在reducer中聚合后提取最大记录

时间:2015-01-07 15:05:18

标签: hadoop mapreduce

我的输入数据格式如下

Roll Number | School Name | Name | Age | Gender | Class | Subject | Marks
04|DPS|Hasini|15|F|tenth|English|80
04|DPS|Hasini|15|F|tenth|Maths|2
04|DPS|Hasini|15|F|tenth|Science|49
04|DPS|Hasini|15|F|tenth|Social|94
04|DPS|Hasini|15|F|tenth|Hindi|6
01|DAV|Praveen|12|M|seventh|Telugu|52
01|DAV|Praveen|12|M|seventh|English|69
01|DAV|Praveen|12|M|seventh|Maths|65
01|DAV|Praveen|12|M|seventh|Science|37

我需要找到班上成绩最高的学生

输出:

Name | Class | Marks ( only those with highest marks)

我写了一个reducer,它聚合了Name和Class并对Marks求和,所以我有一个Name的列表。班级| Total Marks,我试图找出如何提取最高分的学生,我们将不胜感激。

0 个答案:

没有答案