我最近创建了一个包含五台服务器的集群: 主 NODE01 NODE02 node03 node04
为了拥有更多“工人”,我将Nademode添加到/ etc / hadoop / slaves中的从属列表中。
这很有效,主人执行了一些mapReduce工作。
今天我想从worker列表中删除这个节点(这对CPU来说太多了)。我想在我的hdfs-site.xml中设置dfs.exclude,但我担心这也是主服务器。
有人告诉我,执行此操作没有风险吗?
谢谢, 罗曼。
答案 0 :(得分:1)
如果主节点中存储了数据(因为它可能是因为它是DataNode),您将基本上丢失该数据。但是,如果您的复制因子大于1(默认值为3),则无关紧要,因为Hadoop会注意到某些数据丢失(重复不足)并将开始在其他DataNode上再次复制它以达到复制因子。
因此,如果您的复制因子大于1(并且群集运行正常),您可以删除主数据(并再次使其成为NameNode),Hadoop将负责其余部分