我是hadoop的新手。那么请你描述一下我在这里做了什么。 P.S我从我的一个朋友那里得到了这个步骤。
(1)hduser@soham-Inspiron-3521:/usr/local/hadoop/etc/hadoop$ /usr/local/hadoop/bin/hadoop namenode
- 格式
Que 1)为什么我们每次都需要格式化namenode而不是datanode或其他
Que 2)为什么我们每次都使用两条不同的路径
(2)`hduser @ soham-Inspiron-3521:/ usr / local / hadoop / etc / hadoop $ /usr/local/hadoop/sbin/start-all.sh
Que 1)是否需要从“sbin”文件夹
(3)jps显示:
hduser@soham-Inspiron-3521:/usr/local/hadoop/etc/hadoop$ jps
7344 ResourceManager
15019 Jps
7187 SecondaryNameNode
6851 NameNode
7659 NodeManager
Que 1)taskTracker和jobTracker怎么样?
即使localhost也不显示任何DataNode (http://localhost:50070/dfshealth.html#tab-startup-progress)
P.S我知道这些是天真的问题,但我找不到任何可以解决这个问题的解决方案。 快速回复将不胜感激。提前致谢。
答案 0 :(得分:2)
我可以从您提供的信息中说出这一点:
(1)
每次启动hadoop时,您都不必格式化namenode。这是一次性活动。一旦你这样做,那么每当你下次启动hadoop时,你只需要启动HDFS(start-dfs.sh
)和YARN(start-yarn.sh)
服务。[PS不要使用start-all.sh
作为它已被弃用]
关于问题的第二部分,"为什么我们每次使用两条不同的路径",你指的是哪两条路径?
(2)
是的,所有流程都需要从" sbin"你的hadoop安装文件夹(例如/usr/local/hadoop/sbin/
)。
(3)
从jps
输出,您可以清楚地知道您正在使用hadoop 2.0,其中JobTracker和TaskTracker分别具有与ResourceManager和NodeManager相对应的等效(但不完全相同)。
您的DataNode未运行。在启动hadoop服务时检查日志消息,以了解更多有关错误的信息。