应用错误收集

时间：2015-10-28 18:29:11

标签： hadoop mapreduce

在我的map reduce程序中，mapper函数将给出两个键值对：

1）（person1，age）

2）（person2，age）

（为了简单起见，我只保留了2对，如果你可以解释n nos行就会很好）

现在我想写一个减速器，它将比较两者的年龄并给出年龄较大的答案。

我无法理解的是mapper的输出将在文件的不同行中。由于reducer在一个文件上逐行工作，它将如何比较它们。提前谢谢。

答案 0 :(得分：1)

查看以下任何逻辑是否符合您的目的：

一个。

答案 1 :(得分：1)

我认为您的用例可以直接适用于辅助排序技术。

二级排序是一种技术，已被引入以排序＆＃34;值＆＃34;由mapper发出。主要排序将由＆＃34; key＆＃34;由mapper发出。

如果您尝试在reducer级别对所有值进行排序，则可能会出现内存不足的情况。辅助排序应在映射器级别完成。

看看这个article

在上面的示例中，只需替换＆＃34;年＆＃34;与＆＃34; person＆＃34;和＆＃34;温度＆＃34;与＆＃34;年龄＆＃34;

解决方案：

答案 2 :(得分：0)

在reducer方法中，您将获得的是键和值列表。因此，您可以在该键的值列表中找到最小值或最大值。但是，如果您需要与其他键进行比较，那么您可能应该考虑使用单个reducer并从映射器获取所有记录并使用引用变量而不是局部变量处理reducer类中的逻辑并使用更新引用变量每个键的每个最小/最大值