我最近在伪分布式模式下设置了 hadoop ,我创建了数据并将其加载到HDFS中。后来我因为问题而格式化了namenode。现在,当我这样做时,我发现以前在datanode上已经存在的目录和文件不再出现了。 (“格式化”这个词虽然有道理但是现在,我确实有这个疑问。由于namenode不再保存文件的元数据,是否可以访问以前加载的文件截止?如果这是肯定的,那么我们如何删除数据节点上的数据?
答案 0 :(得分:1)
您之前的datanode目录现在已失效,是的。
您需要手动浏览每个datanode并删除这些目录的内容。通过Hadoop CLI没有这样的格式命令
默认情况下,数据节点目录是/ tmp
下的单个文件夹否则,您已将XML文件配置为存储数据的位置