没有映射器的MapReduce作业

时间:2013-11-26 13:13:37

标签: java hadoop mapreduce

这可能是一个非常基本的问题,但对我这样的许多新手来说仍然有帮助。

没有映射器可以有MR工作吗?我们需要实现这个以及实现此目的的任何方案吗?

3 个答案:

答案 0 :(得分:7)

IdentityMapper是一个将输入直接映射到输出的映射器。

假设您的输入格式为键值,并且您在mapper阶段没有任何关系,您唯一想做的就是根据键对值进行分组,并在值的reducer阶段进行一些聚合操作,可以使用此映射器。

答案 1 :(得分:4)

如果MapReduce程序员没有使用JobConf.setMapperClass设置Mapper类,那么IdentityMapper.class将用作默认值。

如果您没有提及映射器,那么将会有一个mapper运行。所以在任何情况下都会运行至少一个映射器。

http://www.fromdev.com/2010/12/interview-questions-hadoop-mapreduce.html

答案 2 :(得分:0)

我看过没有Mapper的MR工作,只减少部分。你的要求很特别。

在我看来,我认为没有mapper的MR工作没有意义。