MapReduce,提取具有最高值的一行

时间:2018-04-12 01:22:46

标签: hadoop mapreduce hdfs

这是减速器的结果(actula输出)。数据是标题(关键),根据书名(价值)借阅多少本书的月份和频率,有没有办法获得最高价值的唯一一行?例如,我想在许多行中选择频率最高的唯一行。如果你知道的方式,请赐教。非常感谢。

import fontawesome from '@fortawesome/fontawesome';
...
fontawesome.config.searchPseudoElements = true;
...
content: "\f12a";
font-family: 'Font Awesome 5 Solid';

1 个答案:

答案 0 :(得分:0)

运行辅助mapreduce作业,接受第一个动作的输出作为输入。要在Mapper中写入的值可以是(NullWritable,line),因为您希望将所有行收集到单个reducer中,但是您不必非常关心密钥,然后解析每行的编号,跟踪当前最大值及其相关线。循环遍历所有值后,写入最大行。

要改善此过程的运行时间,请在作业配置中使用setCombinerClass来使用此新减速器