Question

我有压缩文件，它包含8个大小为5-10kb的xml文件。我把这些数据用于测试目的。我写了一个仅映射程序来解压缩压缩文件。我sbin/start-dfs.sh。我使用am using MR2 API in my code and why it is using MR1 API(mapred) here?命令启动集群。我能够在几秒钟内看到文件系统中的解压缩输出，但处理将持续下一个5-6分钟。我不知道为什么？

MR程序将文件解压缩到此阶段，我可以查看/下载这些文件。

无法理解我的mapreduce程序在这里处理的是什么。我{{1}}当我拥有128mb的压缩文件并且在5-10分钟内解压缩而其余时间忙于执行其他任务时情况会变得更糟。

我遇到的表现令人无法接受，需要了解第二次屏幕截图中hadoop的处理过程。

请帮我理解是安装问题，程序问题还是其他任何问题？

Answer 1

这是一个配置问题，我通过更改mapred-site.xml文件来解决此问题。

<configuration>
<property>  
 <name>mapreduce.framework.name</name>  
 <value>yarn</value>  
 </property>
</configuration>

Hadoop - 了解处理步骤所需的帮助

1 个答案: