我正在使用Prometheus监视来监视几个节点(虚拟机)。 我正在尝试编写一条警报规则,即如果过去24小时内所有cpu内核使用量的平均值小于阈值,则针对该警报触发警报。。 (基本上,如果虚拟机在过去24小时内一直处于空闲状态,则将发出警报)。
为此,我想创建一条记录规则来记录最近24小时的数据,然后我想创建一个警报来分析最近24小时的数据并在查询为true时发出警报。
该规则的Yaml文件应该是什么。
答案 0 :(得分:0)
我建议您检查下一页:
https://awesome-prometheus-alerts.grep.to/
您对节点导出器有一些基本警报(CPU,RAM,磁盘,网络,系统...):
https://awesome-prometheus-alerts.grep.to/rules#host-and-hardware
享受!