普罗米修斯缺席功能

时间:2018-11-07 14:44:52

标签: prometheus prometheus-alertmanager promql

我想检查5分钟内普罗米修斯是否无法使用某个指标。

我正在使用absent(K_KA_GCPP)并给出5分钟的阈值。但似乎我无法将缺少的功能分组在某些标签上,例如网站ID。

如果度量标准不适用于所有4个站点ID,则缺席有效。我想确定指标是否不可用或不存在于所有4个站点中的1个站点ID,并且我不想对查询中的站点ID标签进行硬编码,它应该是通用的。我有什么办法吗?

谢谢, Arnav

1 个答案:

答案 0 :(得分:0)

我通过做这样的事情来达到这个目的:

count(up{job="prometheus"} offset 1h) by (project) unless count(up{job="prometheus"} ) by (project)

如果最近1个小时内缺少该指标,则会触发警报。 您可以在by部分之后添加所需的任何标签(例如,有助于更改标签)。

来源:Prometheus Alert for missing metrics and labels