我有压缩文件,它包含8个大小为5-10kb的xml文件。我把这些数据用于测试目的。我写了一个仅映射程序来解压缩压缩文件。我sbin/start-dfs.sh
。我使用am using MR2 API in my code and why it is using MR1 API(mapred) here?
命令启动集群。我能够在几秒钟内看到文件系统中的解压缩输出,但处理将持续下一个5-6分钟。我不知道为什么?
MR程序将文件解压缩到此阶段,我可以查看/下载这些文件。
无法理解我的mapreduce程序在这里处理的是什么。我{{1}}当我拥有128mb的压缩文件并且在5-10分钟内解压缩而其余时间忙于执行其他任务时情况会变得更糟。
我遇到的表现令人无法接受,需要了解第二次屏幕截图中hadoop的处理过程。
请帮我理解是安装问题,程序问题还是其他任何问题?
答案 0 :(得分:0)
这是一个配置问题,我通过更改mapred-site.xml
文件来解决此问题。
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>