触发多个警报时,未在接收到的警报中指定警报触发的节点名称

时间:2018-10-26 03:28:57

标签: prometheus prometheus-alertmanager prometheus-operator

我已为Prometheus中的节点内存使用情况配置了警报。我的警报模板如下:

[FIRING:1]  (NodeMemory Usage(development) nodes-3z4c monitoring/k8s warning)

Memory usage is critical (current value is: 0.7148033249432908)

当单个节点的阈值超过阈值时,我会收到警报中带有的节点的名称(此处的节点名称为nodes-3z4c),如下所示:

[FIRING:4] NodeMemory Usage (monitoring/k8s)
Memory usage is critical (current value is: 0.7319404231240473)
Memory usage is critical (current value is: 0.7856648253333621)

但是问题是,当多个节点超过阈值时,警报通知中并没有指定多个节点的名称,并得到如下通知:

{{1}}

有人可以帮我弄清楚这个问题吗?

1 个答案:

答案 0 :(得分:0)

这与您定义警报的方式无关。如果您在Alertmanager用户界面中查看它,则会看到所有标签都在那里。

要么是template you use(如果Alertmanager直接发送消息),要么是您使用的任何Webhook处理程序,仅保留通用标签并丢弃所有其他内容。