在Cloudera Manager中的安全群集上启用HA名称节点失败

时间:2013-02-23 20:57:46

标签: hdfs cloudera high-availability

我正在运行CDH4.1.2安全集群,它可以使用单个namenode + secondarynamenode配置正常工作,但是当我尝试从Cloudera Manager界面启用高可用性(基于仲裁)时,它将在16的第10步中死亡,“启动将转换为活动模式namenode的NameNode([my namenode's hostname])“。

深入挖掘角色日志文件会产生以下致命错误:

Exception in namenode joinjava.lang.IllegalArgumentException: Does not contain a valid host:port authority: [my namenode's fqhn]:[my namenode's fqhn]:0 at
org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:206) at
org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:158) at
org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:147) at
org.apache.hadoop.hdfs.server.namenode.NameNodeHttpServer.start(NameNodeHttpServer.java:143) at
org.apache.hadoop.hdfs.server.namenode.NameNode.startHttpServer(NameNode.java:547) at
org.apache.hadoop.hdfs.server.namenode.NameNode.startCommonServices(NameNode.java:480) at
org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:443) at
org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:608) at
org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:589) at
org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1140) at
org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1204)

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

看起来你有两个问题:

  1. NameNode的IP地址正在解析为“my namenode的fqhn”而不是常规主机名。检查/ etc / hosts文件以解决此问题。
  2. 您需要配置dfs.https.port。使用Cloudera Manager免费版,您必须为安全阀添加适当的配置以实现安全性。作为其中一部分,您需要配置dfs.https.port。
  3. 鉴于即使在非HA模式下也遍历了此代码路径,我很惊讶您能够在启用HA之前让您的安全NameNode正确启动。如果您还没有,我建议您首先启用安全性,测试所有HDFS角色是否正确启动,然后启用HA。