我想检查5分钟内普罗米修斯是否无法使用某个指标。
我正在使用absent(K_KA_GCPP)并给出5分钟的阈值。但似乎我无法将缺少的功能分组在某些标签上,例如网站ID。
如果度量标准不适用于所有4个站点ID,则缺席有效。我想确定指标是否不可用或不存在于所有4个站点中的1个站点ID,并且我不想对查询中的站点ID标签进行硬编码,它应该是通用的。我有什么办法吗?
谢谢, Arnav
答案 0 :(得分:0)
我通过做这样的事情来达到这个目的:
count(up{job="prometheus"} offset 1h) by (project) unless count(up{job="prometheus"} ) by (project)
如果最近1个小时内缺少该指标,则会触发警报。
您可以在by
部分之后添加所需的任何标签(例如,有助于更改标签)。