什么是启动hadoop的一步一步的过程

时间:2016-05-03 05:06:12

标签: hadoop hdfs hadoop2

我是hadoop的新手。那么请你描述一下我在这里做了什么。 P.S我从我的一个朋友那里得到了这个步骤。

(1)hduser@soham-Inspiron-3521:/usr/local/hadoop/etc/hadoop$ /usr/local/hadoop/bin/hadoop namenode - 格式
Que 1)为什么我们每次都需要格式化namenode而不是datanode或其他 Que 2)为什么我们每次都使用两条不同的路径

(2)`hduser @ soham-Inspiron-3521:/ usr / local / hadoop / etc / hadoop $ /usr/local/hadoop/sbin/start-all.sh
Que 1)是否需要从“sbin”文件夹

启动所有进程

(3)jps显示:

hduser@soham-Inspiron-3521:/usr/local/hadoop/etc/hadoop$ jps
7344 ResourceManager
15019 Jps
7187 SecondaryNameNode
6851 NameNode
7659 NodeManager

Que 1)taskTracker和jobTracker怎么样?

即使localhost也不显示任何DataNode (http://localhost:50070/dfshealth.html#tab-startup-progress

P.S我知道这些是天真的问题,但我找不到任何可以解决这个问题的解决方案。 快速回复将不胜感激。提前致谢。

1 个答案:

答案 0 :(得分:2)

我可以从您提供的信息中说出这一点:

(1) 每次启动hadoop时,您都不必格式化namenode。这是一次性活动。一旦你这样做,那么每当你下次启动hadoop时,你只需要启动HDFS(start-dfs.sh)和YARN(start-yarn.sh)服务。[PS不要使用start-all.sh作为它已被弃用]

关于问题的第二部分,"为什么我们每次使用两条不同的路径",你指的是哪两条路径?

(2) 是的,所有流程都需要从" sbin"你的hadoop安装文件夹(例如/usr/local/hadoop/sbin/)。

(3) 从jps输出,您可以清楚地知道您正在使用hadoop 2.0,其中JobTracker和TaskTracker分别具有与ResourceManager和NodeManager相对应的等效(但不完全相同)。

您的DataNode未运行。在启动hadoop服务时检查日志消息,以了解更多有关错误的信息。