Laconically:我是否应该在关机操作后启动HDFS 每次我回到集群?
我已经成功创建了一个Hadoop集群(在loosing some battles之后),现在我想非常小心地继续这个。
每次启动群集时,我应该执行start-dfs.sh
,还是已准备好执行我的应用程序代码?与start-yarn.sh
相同。
我担心如果我在没有一切正常的情况下运行它,它可能会在执行后留下垃圾目录。
答案 0 :(得分:1)
只是玩Hortonworks和Cloudera沙箱,我可以说打开和关闭它们似乎没有表现出任何“副作用”。
但是,每次启动集群时都需要启动所需的服务。
就真正的集群中的电源循环而言,建议在关闭电源之前停止运行在各个节点上的服务(stop-dfs.sh
和stop-yarn.sh
)。这样就没有奇怪的问题,停止服务的方式上的任何错误都将在每个节点上正确记录。