CDH4将Cloudera Manager还原到现有群集

时间:2015-02-14 05:53:34

标签: cloudera-cdh data-recovery cloudera-manager

我们生产的Cloudera Manager(4.7)节点出错了所以我们在该节点上安装了一个新的操作系统。 我们正在尝试从(嵌入式)postgresql数据库的备份中恢复Cloudera Manager。我们希望通过使用恢复的数据库,CM可以使用现有配置管理现有集群。

我们正在做一些POC,我们正在尝试将cloudera管理器移植到新服务器,其步骤如下所示。 (最终我们将在同一节点上安装CM)

  1. 安装cloudera-server-daemons cloudera-server
  2. 安装cloudera-server-db
  3. sudo service cloudera-server-db start =>这创造了基本的角色;重新生成密码等。
  4. 所以从我们的pg_dumpall foo.sql中删除了创建角色和密码以及数据库的初始语句。 pql -U cloudera-scm -h localhost -p 7432 -f foo.sql postgres。这已成功完成。
  5. 在群集中的每个on节点上,将/etc/cloudera-scm-agent/config.ini更改为指向新节点
  6. sudo service cloudera-server start。 =>我们期待CM接收配置并加载。但是它需要我们安装页面
  7. 安装免费版。搜索ips或我们看到主机可用。
  8. 接下来,它会更新群集中每个节点上的cdh软件包,并要求我们安装服务。
  9. 在此之后,这个过程有点不清楚。但是,我们确实设法将角色分配给适当的节点,例如。使用相同根目录的HDFS没有格式化,一切似乎都可以。但是我们缺少所有配置。这似乎表明CM没有读取恢复的数据库。
  10. 上述步骤似乎不是恢复cloudera经理状态的正确方法。这个Reference可能列出了一种无缝的方法。按照链接中提到的步骤,我们仍然无法让CM读取已恢复的数据库。有人能指出正确的步骤吗? 任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:1)

经过大量的poc后,我们得出结论,db转储没用。 幸运的是,我们有了postgresql的/ data目录。

我们选择了同一台机器进行重新安装(因此无需在/etc/cloudera-scm-agent/config.ini中使用主机名和ipaddresses) 所以我们安装了正确的postgresql版本,cloudera-scm-server,cloudera-scm-server-db,cloudera-scm-agent,cloudera-scm-daemons及其相关的依赖项。

我们遇到的一个问题是我们丢失了db.mgmt.properties。我们能够改变用户的密码(amon,hmon,smon,nav等)。密码的逻辑是md5(yourPasswordUser),使用postgres中提供的md5函数。 此外,您需要在“md5”前加上此密码。

启动cloudera-scm-server,所有服务都会显示出来。如果存在数据库连接问题,则转到相关服务,例如活动监视并将密码更改为yourPassword。重新启动。

这对我们有用。我们不需要安装或重新配置服务。