我已经在Kubernetes集群中设置了Grafana进行监视。但是我真的很好奇如何监视监视系统(Grafana)?
我能想到的一种解决方案是在prometheus-alertmanager中设置一个警报,以便每当Grafana pod进入错误/ CarshLoopBackOff状态时,我都会收到警报。
答案 0 :(得分:0)
Grafana能够以Prometheus格式(https://grafana.com/docs/administration/metrics/)公开自己的指标。因此,配置抓取并在作业失败时发送警报不是什么大事
- alert: GrafanaDown
expr: up{job="GrafanaDown"} == 0
for: 1m
labels:
severity: critical
annotations:
summary: "Instance {{ $labels.instance }} is down"
description: "{{ $labels.instance }} of job {{ $labels.job }} is down."