Cloudant:运行weatherreport以检查群集运行状况时出错

时间:2016-02-29 13:26:05

标签: cluster-computing cloudant

我们有三个节点群集设置并面临运行天气报告命令的问题。 通过查看错误,很明显,天气报告实用程序运行的机器无法连接到其他两台机器。我检查了所有机器,可以使用fqdn访问它们。但是从消息中看起来它在连接到对等机器时使用短名称。那么如何检查对等机器名称的位置?所以我可以尝试将它们更改为完整的机器名称,这可能对我有用。如果有任何其他解决方案,请告诉我们。

错误即将发生

['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2031'
['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2032'
['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2033'

['cloudant@machine2032.domain.com'] [crit] Rebuilding this node will leave the following shard with NO live copies: default/t_alpha e0000000-ffffffff, default/t_alpha a0000000-bfffffff, default/t_alpha 60000000-7fffffff, default/t_alpha 20000000-3fffffff, default/metrics_app e0000000-ffffffff, default/metrics_app a0000000-bfffffff, default/metrics_app 60000000-7fffffff, default/metrics_app 20000000-3fffffff

1 个答案:

答案 0 :(得分:0)

我找到了解决这个问题的方法。 当第一次创建DB时,使用了短名称,因此在数据库中可能会引用短名称来连接到其他对等主机。

现在Cloudant Local安装处于有问题的阶段,要使其保持一致,将删除所有数据库节点上/ srv / cloudant /下的所有文件。这将删除所有默认的Cloudant数据库。然后像以前一样在每个节点上再次运行configure.sh脚本,但现在“hostname -f”正确输出完全限定的主机名,然后再次创建数据库。