获得MapReduce的第二名得分手

时间:2016-06-27 17:56:19

标签: hadoop mapreduce

我是MapReduce的新手,正在努力寻找状态输入的第二个最高分 下面是数据

用户进入CA并需要找到最高的第二个分数,在这种情况下,Raphel有900分(马丁是最佳射手)

enter image description here

1 个答案:

答案 0 :(得分:0)

以下是我为达成解决方案所采取的合理步骤。

  1. 读取记录可能包含state as keyscore as a value的输入文件。这可以是Map工作。
  2. 发布此内容后,您需要将其传递给reduce作业。 IMO,因为state被选为关键,随机和排序阶段应该将具有相同状态的所有记录组合在一起。
  3. Reduce工作中,您可以通过订购分数来实现第二个最高分的选择。