hadoop在哪里存储mapper,partitioner和combiner的输出文件?

时间:2015-03-06 17:35:27

标签: hadoop mapreduce

我在伪分布式hadoop设置上运行mapreduce作业。我在哪里可以找到mapper,partitioner和combiner的输出文件?有没有办法检查每个操作的输出?

1 个答案:

答案 0 :(得分:1)

MapReduce中的中间输出存储在运行任务的节点上的本地临时存储中(不在HDFS中)。

您可以查看本地临时目录所在的Hadoop conf,并逐个节点地手动检查它们。

通常,可能有更好的方法通过日志消息或计数器执行您认为要执行的操作。您可以做的另一件事是关闭Reducer,以便Mappers直接写入HDFS,以便您可以检查它。