我和我的一位前辈讨论过,他提出了这样一个问题:
假设我有一个大约需要15天才完成的Hadoop工作,并且在NameNode关闭的第14天。
现在我们不想丢失已经完成的所有处理,因为由于时间限制,此过程不能再次重复。
- 那么,如果NameNode出现故障,过程/会发生什么?加工会怎样?
- 到目前为止,我是否丢失了对所发生数据的所有处理?
- 从NameNode失败的位置恢复作业吗?
- 如果出现硬件问题并且需要为NameNode发布新计算机,它是否会从早期NameNode失败的位置恢复作业?
醇>
PS->这不是高可用性NameNode