我遇到了一个问题,我有一个Ops Manager,它假设将MongoDB集群作为自动集群运行。
突然,服务器意外地开始关闭 - 而任何日志文件中都没有错误,表明问题何时出现。
Ops Manager卡在蓝色标签上
我们正在部署您的更改。这可能需要几分钟
它永远不会消失。
由于此环境基于自动化功能,因此mms正在管理服务器上的用户并运行来自" mongod"的所有进程。即使是Root(管理员)也无法访问。
就Ops管理器而言,它显示副本集中的分片虽然已经停止运行,但认为死亡的mongos还活着。
以前是否有人遇到过这种情况并且可以提供帮助?
谢谢, Eliran。
答案 0 :(得分:0)
发现问题:群集中的服务器之间存在ntp不匹配,所以发生的事情是服务器未同步,并且每次操作管理器执行的操作都会在错误的时间内获得响应无法使用它的时间限制。
在将所有ntp重新配置回同一个之后 - 一切都恢复到应该如何:)