我是运行 Prometheus 和 Graphana 的新手。我想创建一个警报,当 Kubernetes pod 处于挂起状态超过 15 分钟时会触发该警报。我使用的 PromQL 查询是:
<块引用>kube_pod_status_phase{exported_namespace="mynamespace", phase="Pending"} > 0
我无法弄清楚的是如何根据 pod 处于该状态的时间来构建警报。我已经在 Graphana 中尝试了一些警报条件的排列:
<块引用>当 avg() OF 查询(A,15m,现在)高于 1
所有都根据状态中的 Pod 数量而不是持续时间发出警报。
如何根据状态时间构建警报?
请&谢谢