使用Hadoop NameNode,Checkpoint节点和备份节点有哪些优缺点?

时间:2012-05-03 03:32:54

标签: hadoop

我目前正在评估Hadoop 1.0.2的内部项目。

Hadoop文档说

  

The Secondary NameNode has been deprecated. Instead, consider using the Checkpoint Node or Backup Node

有关 这三个选项以及 的内容的信息,但我无法找到有关推荐的三个选项中的哪一个的信息在哪种情况下。

1 个答案:

答案 0 :(得分:2)

基本上,检查点节点是辅助名称节点的新实现,备份点是在进入namenode的热备份的过程中的临时版本(此外,它可以通过分离读取和写入来提供小的性能提升 - 读取名称节点并写入备份节点

来自Backupnode documentation

,如Konstantin Shvachko所解释的那样:

  

此修补程序引入了两种新类型的名称节点:Checkpoint节点和Backup节点。

     
      
  • 检查点节点对检查点名称 - 节点元数据的作用   合并图像和编辑文件。
  •   
  • 备份节点扩展功能   Checkpointer,它可以接收文件的在线更新   系统元数据,将它们应用到其内存状态并持续存在   磁盘就像名称节点一样。因此可以随时备份节点   包含内存中和命名空间的最新命名空间图像   本地磁盘。这也导致更有效的检查点   因为备份节点不需要从活动状态传输文件   名称节点,不需要重播(合并)编辑。
  •   
  • Term Standby节点   保留用于进一步扩展备份节点功能,   当集群将能够切换到新的名称节点时,如果   活跃的死亡。这在“热备份条款”部分中提到   设计文件。
  •   
     

典型用例:

     
      
  1. 仅运行Checkpoint节点以创建检查点。应该使用它   而不是当前的SecondaryNameNode,它被不推荐使用   补丁。我重用了很多SecondaryNameNode代码,所以我们努力了   没有浪费,只是进化了。
  2.   
  3. 运行备份节点以支持在线   流编辑和有效的检查点。这特别   目标是将NFS作为远程存储进行编辑。
  4.   
  5. 运行NameNode   根本没有持久存储并委托所有“持久存储”   备份节点的功能。这里的诀窍是启动name-node   使用-importCheckpoint选项,然后运行备份节点。
  6.