Hadoop - 了解处理步骤所需的帮助

时间:2015-09-25 17:56:01

标签: hadoop mapreduce

我有压缩文件,它包含8个大小为5-10kb的xml文件。我把这些数据用于测试目的。我写了一个仅映射程序来解压缩压缩文件。我sbin/start-dfs.sh。我使用am using MR2 API in my code and why it is using MR1 API(mapred) here?命令启动集群。我能够在几秒钟内看到文件系统中的解压缩输出,但处理将持续下一个5-6分钟。我不知道为什么?

enter image description here

MR程序将文件解压缩到此阶段,我可以查看/下载这些文件。

enter image description here

无法理解我的mapreduce程序在这里处理的是什么。我{{1}}当我拥有128mb的压缩文件并且在5-10分钟内解压缩而其余时间忙于执行其他任务时情况会变得更糟。

我遇到的表现令人无法接受,需要了解第二次屏幕截图中hadoop的处理过程。

请帮我理解是安装问题,程序问题还是其他任何问题?

1 个答案:

答案 0 :(得分:0)

这是一个配置问题,我通过更改mapred-site.xml文件来解决此问题。

<configuration>
<property>  
 <name>mapreduce.framework.name</name>  
 <value>yarn</value>  
 </property>
</configuration>