我正在尝试使用prometheus-grafana-alertmanager-blackbox_exporter进行黑盒监视。 我的问题是: 我在群集中有很多实例。所以我将其标记为
probe_success {cluster =“ cluster-1”,instance =“ instance-1”}
probe_success {cluster =“ cluster-1”,instance =“ instance-2”}
现在,我只想计算在最近30m的范围内,集群1上的probe_success度量多少次返回值1或0。 普罗米修斯真的不能做这件事吗?我找不到任何文档或问题
答案 0 :(得分:0)
您要执行的操作称为aggregation over time。在您的情况下,它是30分钟内指标的总和:
sum_over_time(probe_success[30m])
请注意,您要计算的内容很难执行,因为这取决于最近30分钟内的刮擦次数。原因是,如果导出器或Prometheus停止运行(表示未生成任何度量标准),或者您在Prometheus中更改了刮擦间隔,则该值的含义将发生变化。
通常最好使用avg_over_time
来表示应用程序在最近30分钟内可测量的运行时间百分比。