对于 Hadoop 2.6.0 中的伪分发模式,我们每次都必须格式化namenode。
我在家里使用hadoop 2.6.0,但每次使用start-dfs.sh和start-yarn.sh我都要格式化我的namenode。
是否还有其他方法可以避免这种情况? Plz建议我摆脱这个!!
答案 0 :(得分:1)
不,即使在伪分布式模式下,您也不必始终格式化NameNode。除非NameNode丢失元数据信息,否则不建议多次格式化NameNode。
原因可能是:告诉NameNode将其元数据信息存储在磁盘上的属性为dfs.name.dir
(已弃用)或dfs.namenode.name.dir
,默认情况下指向file://${hadoop.tmp.dir}/dfs/name
指向/tmp/dfs/name
所以每次重新启动系统时,/tmp
目录都会被清除,因此您必须再次格式化NameNode。
因此,请确保将属性dfs.namenode.name.dir
指向一个未被清除的更持久的位置。