我将dcos集群部署在具有几个中-从代理的aws ec2实例上。其中很少有人意外终止。 Mesos主服务器将其标记为"unreachable"
。我想将其状态从“无法访问”更改为"Gone"
。为此,dcos提供以下命令:
dcos node decommission <mesos-id>
但是,我找不到无法访问的mesos-agent的mesos-id。 mesos-master
和dc/os
的GUI /日志都没有显示这些节点的任何信息。
我的问题是如何获取所有不可达(或停用)的mesos-slave代理的列表?
感谢您的期待。
答案 0 :(得分:1)
要获取标记为不可达的代理的历史记录,请使用以下命令:
grep unreachable /var/log/mesos/*.INFO.*
或
gawk 'match($0, /.*Marking agent (.*) \(.*\) unreachable.*/, a) {print a[1]}' /var/log/mesos/*.INFO.*|sort|uniq
但是,如果您只想重置Web ui中报告的指标,则需要重新启动mesos-master服务(请查看https://mesos.apache.org/documentation/latest/monitoring/)