5分钟内部署不足80%时发出警报

时间:2018-08-14 22:31:21

标签: kubernetes grafana prometheus

正如标题所要求的,我想知道我的10个Pod的部署在5分钟内何时始终少于8个。

我不想为此使用Alertmanager,而是严格通过promQL和grafana的警报方案使用

真正幼稚的方法就是这样

(kube_deployment_status_replicas_unavailable > 0)
  or (kube_deployment_status_replicas != kube_deployment_status_replicas_available)

但是,这既不考虑违规发生的时间,也不考虑实际丢失了多少个豆荚。

一个想法是使用max_over_time()并仅在5分钟间隔内取最大值。问题是与kubernetes部署副本有关的一切都返回一个即时向量,而不是我需要聚合的范围向量。

这似乎是一件很普通的事情。我该怎么办?

0 个答案:

没有答案