查找无法访问/已停用的Mesos Slave代理

时间:2018-07-24 04:45:41

标签: mesos mesosphere dcos

我将dcos集群部署在具有几个中-从代理的aws ec2实例上。其中很少有人意外终止。 Mesos主服务器将其标记为"unreachable"。我想将其状态从“无法访问”更改为"Gone"。为此,dcos提供以下命令:

dcos node decommission <mesos-id>

但是,我找不到无法访问的mesos-agent的mesos-id。 mesos-masterdc/os的GUI /日志都没有显示这些节点的任何信息。

我的问题是如何获取所有不可达(或停用)的mesos-slave代理的列表?

感谢您的期待。

1 个答案:

答案 0 :(得分:1)

要获取标记为不可达的代理的历史记录,请使用以下命令:

grep unreachable /var/log/mesos/*.INFO.*

gawk 'match($0, /.*Marking agent (.*) \(.*\) unreachable.*/, a) {print a[1]}' /var/log/mesos/*.INFO.*|sort|uniq

但是,如果您只想重置Web ui中报告的指标,则需要重新启动mesos-master服务(请查看https://mesos.apache.org/documentation/latest/monitoring/