应用错误收集

应该在哪里进行计算密集型工作？ Hadoop MapReduce中的Mapper方法或Reducer方法

时间：2014-11-30 11:29:15

标签： java hadoop mapreduce mapper

我正在处理大型文本文件。 输入文本文件中的每条记录都是一行，我在这些记录中搜索某些关键字我想知道在 Hadoop MapReduce 中工作时，以下哪种两种方法 更高效（时间复杂度）：

在地图功能中搜索 Mapper
在 Reducer

reduce

请帮助！

1 个答案:

答案 0 :(得分：3)

两者都应该没问题，但是，根据你的输入我会在map函数中尝试它，因为：

只有找到关键字，才会将数据发送到组并减少阶段。如果与关键词匹配的数据较少，则组和缩减的开销会显着降低。