我今天遇到一个奇怪的问题。首先,昨天当我离开办公室时,每件事情仍然正常,但是今天当我回去工作时,我的DC / OS仪表板显示我没有运行任何服务,或连接了节点。
我之前曾经遇到过这个问题一两次,并且与马拉松无法选举大师有关。然后,3个主节点中的一个也在日志中显示出很多错误。这可以通过停止/启动该主机上的dcos-marathon服务来解决,该服务将其带回马拉松组。
我确实再次看到了节点和服务。但现在它有时会告诉我只有一个Node连接,然后再连接3个,再次只有1个等等。
当我在冲突的主机上停止dcos-mesos-master进程时,这会停止并且我有一个稳定的主群集(但可能没有真正的弹性)。
看起来失败的节点正试图成为主人,这导致了这个..我试图搜索重新加入失败的mesos-master ..但是出现了
我在CoreOS环境中运行DC / OS。
答案 0 :(得分:0)
虽然描述了一般行为,但您可能需要提供更多细节,例如内核版本,DC / OS版本,规格等。我可以提供的最简单的答案是提供给我们的是通过他们在Slack(https://dcos-community.slack.com/)的支持渠道。