Hadoop节点高可用性

时间:2013-04-08 09:53:00

标签: hadoop hdfs

如何获得namenode的高可用性? 我们是否应该在集群中配置一些东西。(我们应该有2个节点(名称节点)

2 个答案:

答案 0 :(得分:0)

互联网上有很多关于如何在hadoop v1中执行此操作的资源,例如http://www.hadoopsphere.com/2012/11/understanding-high-availability-options.htmlhttp://hortonworks.com/blog/ha-namenode-for-hdfs-with-hadoop-1-0-part-1/

在Hadoop 2.0中,这本身就得到了解决。

答案 1 :(得分:0)

Datanode:他们做实际工作..

NameNode:管理DataNode的工作。

群集可以有多个DataNode但只有一个NameNode。 在一组物理盒中,通常一个盒子运行NameNode,而其他盒子运行DataNodes。

将NameNode与执行grunt工作的DataNode分开是一个好主意。原因是NameNode工作已经是内存明智的密集型。 NameNode可能是群集的单点故障也无济于事。 因此,经常重复建议使NameNode在具有防弹可靠性的单独的高可用性服务器上运行。