Hadoop集群是机架的集合。每个机架是否包含一个NameNode,或者整个群集只有一个NameNode? p>
答案 0 :(得分:0)
在典型的Hadoop部署中,每个机架不会有一个NameNode。许多小规模部署使用一个NameNode,并使用可选的备用NameNode进行自动故障转移。
但是,可以拥有多个NameNode。 Hadoop版本0.23引入了联合NameNode以允许水平扩展。但是,就像我说的,在许多常见用例中,每个集群都有一个NameNode(带有可选的Standby NameNode或Secondary NameNode)。
有关详情,请参阅here。
答案 1 :(得分:0)
这取决于机架的配置以及名称节点。您可以为整个群集设置1个名称节点。如果您认真考虑性能,则可以为其他机架组配置另一个名称节点。但是不建议每个机架使用1个名称节点。在Hadoop 1.x中,您只能拥有一个名称节点(只有一个命名空间),但在Hadoop 2.x中,我们可以使用名称空间联合,我们可以在其中拥有多个名称节点,通常只为特定元数据服务。
答案 2 :(得分:0)
一。您只能在群集中拥有一个名称节点。
细节 - 在Yarn / Hadoop 2.0中,它们带有活动名称节点和备用名称节点的概念。 (这是大多数人感到困惑的地方。他们认为它们是群集中的2个节点)。但在这种纱线架构中,还会有一个名称节点,它将从数据节点接收心跳和块报告。这意味着将有一个名称节点保持活动状态。 虽然这个名称节点将通过日志节点从活动名称节点接收元数据文件,以便在名称节点失败时它可以接管。
现在,如果你有一个大量节点的集群说2000节点,那么在这种情况下你也可以只有一个活动名称节点,或者你可以有另一种方法在子集群中划分你的集群现在这些子集群每个群集也将有一个Active节点,但这会提高处理速度,因为现在您的名称节点与数据节点的比率更好
结论 - 在任何情况下,每个群集都可以有一个节点