节点处于不可计划状态时,Prometheus会触发警报

时间:2018-09-19 21:30:31

标签: kubernetes prometheus prometheus-alertmanager

有人可以帮助我编写promql查询来获取节点状态(无论节点是否可调度)。预先感谢。

3 个答案:

答案 0 :(得分:2)

如果您使用prometheus-operator,则kube-state-metrics返回kube_node_status_condition指标:

sum(kube_node_status_condition{condition="Ready",status!="true"})

答案 1 :(得分:0)

上面的答案将显示一个节点是否准备就绪-节点可以准备就绪但不可调度(例如,如果您使用以下方法封锁节点,则为

kubectl cordon NODE)

下面的示例应涵盖一个不可调度的就绪节点,该节点也可以通过kube-state-metrics

使用
sum(kube_node_spec_unschedulable) by (node)

答案 2 :(得分:0)

我引用的是machine_cpu_cores指标。它只会显示Kubernetes集群中准备就绪的节点。