我已为Prometheus中的节点内存使用情况配置了警报。我的警报模板如下:
[FIRING:1] (NodeMemory Usage(development) nodes-3z4c monitoring/k8s warning)
Memory usage is critical (current value is: 0.7148033249432908)
当单个节点的阈值超过阈值时,我会收到警报中带有的节点的名称(此处的节点名称为nodes-3z4c),如下所示:
[FIRING:4] NodeMemory Usage (monitoring/k8s)
Memory usage is critical (current value is: 0.7319404231240473)
Memory usage is critical (current value is: 0.7856648253333621)
但是问题是,当多个节点超过阈值时,警报通知中并没有指定多个节点的名称,并得到如下通知:
{{1}}
有人可以帮我弄清楚这个问题吗?
答案 0 :(得分:0)
这与您定义警报的方式无关。如果您在Alertmanager用户界面中查看它,则会看到所有标签都在那里。
要么是template you use(如果Alertmanager直接发送消息),要么是您使用的任何Webhook处理程序,仅保留通用标签并丢弃所有其他内容。