查询Hadoop行为

时间:2014-09-03 05:58:46

标签: hadoop

我和我的一位前辈讨论过,他提出了这样一个问题:

假设我有一个大约需要15天才完成的Hadoop工作,并且在NameNode关闭的第14天。 现在我们不想丢失已经完成的所有处理,因为由于时间限制,此过程不能再次重复。

  1. 那么,如果NameNode出现故障,过程/会发生什么?加工会怎样?
  2. 到目前为止,我是否丢失了对所发生数据的所有处理?
  3. 从NameNode失败的位置恢复作业吗?
  4. 如果出现硬件问题并且需要为NameNode发布新计算机,它是否会从早期NameNode失败的位置恢复作业?
  5. PS->这不是高可用性NameNode

0 个答案:

没有答案