是否可以在prometheus警报中添加嵌套查询? 我正在使用prometheus来监控kubernetes集群。
如果节点已关闭但是我想配置警报,则生成警报,以便在任何节点关闭时,prometheus不应发送正在其上运行的pod和服务的警报。
像这样,
if(pod_down)
if(corresponding_node_down)
//dont send alert
//node down alert is in firing state
答案 0 :(得分:2)
如果一个节点关闭,那么Kubernetes应该自动处理并在其他地方移动服务。因此,这样的警报不是很有用。
我建议你做的是警告用户可见的症状,例如高延迟和错误率,而不是个别原因,例如机器或容器停机。
答案 1 :(得分:1)
看看这个Prometheus Alertmanager配置。
link:prometheus.io/docs/alerting/configuration/#inhibit_rule
如果某些其他警报已经触发,则抑制是一种抑制某些警报通知的概念。
示例:正在触发警报,通知无法访问整个群集。 Alertmanager可以配置为在该特定警报触发时将与该集群有关的所有其他警报静音。这可以防止发送与实际问题无关的数百或数千个触发警报。