Kubernetes中的“活跃性/就绪性”探针失败时如何设置警报

时间:2020-07-05 04:39:58

标签: kubernetes alert prometheus

我正在尝试为部署了我的应用程序的Kubernetes POD设置警报/监视器。

我正在使用 Kubernetes = 1.15

我正在尝试针对以下两种情况设置警报:

  1. 当任何POD由于某种原因而下降时,应该触发警报。
  2. 当我的应用程序在任何POD上出现故障时,都应触发警报。

对于(1),如果Liveness探针失败> = 1,则我将设置警报,如果您关心的只是一个或多个吊舱掉落

对于(2),我正在为Readiness probe_type设置警报,结果为> = 1失败

对于(1),我正在使用 kubelet:prober_probe_total {probe_type = Readiness,result = failed,..}

对于(2),我正在使用 kubelet:prober_probe_total {probe_type = Liveness,result = failed,..}

参考:

  1. https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/prober/prober_manager.go

  2. https://godoc.org/k8s.io/kubernetes/pkg/kubelet/prober

我一直在想,当警报的任何非零值都应该触发警报。但是,即使一切正常,我仍会得到非零数据。

所以我在这里一无所知。

0 个答案:

没有答案