我有一个带有1个名称节点和4个数据节点的hadoop集群,HDFS-site.xml中的复制值设置为3.我最近更换了一个数据节点机器并重新启动了集群。从名称节点到任何数据节点的SSH设置为使用无密码登录,并且新数据节点上的防火墙也已关闭。群集工作正常。但是,名称节点仅显示3个数据节点,其中新添加的数据节点丢失。有趣的是,JPS显示DataNode和TaskTracker进程正在名称节点未显示的数据节点上运行。可能有什么不对?谢谢!
更新:刚发现有问题的节点上的core-site.xml和mapred-site.xml指向错误的namenode主机。在更正这些值并重新启动集群后,集群摘要将显示所有数据节点。
答案 0 :(得分:0)
检查名称节点框上的conf \ slaves文件。它列出了数据节点 - 您可能希望确保在那里找到新添加的数据节点。 请重新启动名称节点。