应用错误收集

hadoop中磁盘或数据节点故障和恢复的过程是什么

时间：2016-08-10 11:53:15

标签： hadoop procedure data-recovery

据我所知，Hadoop中的块和副本存储过程是由BlockPlacementPolicy函数或进程进行的，但这是针对初始存储过程（第一次将数据存储在HDFS系统上）。我感兴趣的是哪个进程或java函数负责恢复（通过恢复我的意思是解决重复不足的问题）磁盘或Datanode失败后的数据。我的想法是改变主管功能，根据我的需要工作，这意味着保持副本的数量并将新副本（恢复的副本）存储在我感兴趣的磁盘上。

1 个答案:

答案 0 :(得分：0)

当节点发生故障时，存储在其中的块不再计为可用于HDFS。通过查看节点出现故障或被禁用时未复制块的数量，可以很容易地看到这一点。

通常，系统会在发生时（以及容量可用时）尝试解决重复不足问题。所以基本上你想要构建的解决方案应该已经到位。

注意：Hadoop不会尝试从损坏的节点恢复数据，而只是根据未损坏的节点复制相关的块。