正如标题所要求的,我想知道我的10个Pod的部署在5分钟内何时始终少于8个。
我不想为此使用Alertmanager,而是严格通过promQL和grafana的警报方案使用
。真正幼稚的方法就是这样
(kube_deployment_status_replicas_unavailable > 0)
or (kube_deployment_status_replicas != kube_deployment_status_replicas_available)
但是,这既不考虑违规发生的时间,也不考虑实际丢失了多少个豆荚。
一个想法是使用max_over_time()并仅在5分钟间隔内取最大值。问题是与kubernetes部署副本有关的一切都返回一个即时向量,而不是我需要聚合的范围向量。
这似乎是一件很普通的事情。我该怎么办?