我已经部署了 kube-prometheus-stack
,默认规则/警报对我帮助很大,但我需要创建自定义规则。
具体来说,当我的 pod 超过其限制 50%(警告)或 70%(严重)时,我想获取信息。
例如,如果我的 pod 1 CPU / 1 GB RAM 的限制是,我想在 pod 使用 1.5 vCPU 或 1.5 GB RAM 时发出警报
我知道这需要将 kube_pod_container_resource_limits_cpu_cores
和 kube_pod_container_resource_limits_memory_bytes
以及诸如 node_namespace_pod_container:container_cpu_usage_seconds_total:sum_rate
之类的东西结合起来用于容器的当前 CPU 使用率,或者 node_namespace_pod_container:container_memory_working_set_bytes
但我不知道如何将这两个指标分开并得到当前使用量超过限制的最终结果
为了设置 50% / 70%,我当然会创建两个具有不同严重性的不同警报,但是 PromQL 语句让我烦恼。非常感谢您的帮助!