我有一个PromQL查询,它查看每个分位数的最大延迟,并在Grafana中显示数据,但它显示了已重新部署且不再存在的Pod中的数据。吊舱比15天的陈旧时期还年轻。
以下是查询:max(latency{quantile="..."})
发现的最大等待时间是从调节开始到重新部署并恢复正常后不久,现在我只想看看当前设备的最大等待时间。
到目前为止,我发现的所有有关陈旧性的信息都应该在幕后进行过滤,但是看起来好像不是在当前设置中正在发生,所以我不知道该怎么做。
在查询中手动添加特定的实例ID时-它可以很好地工作,但是一旦重新部署ID,它就会更改:max(latency{quantile="...", exported_instance="ID"})
以下是我发现的类似问题的一长串,有的未得到回答,有的未要求相同。我确实发现的想法有些相关,但不能以可持续的方式解决问题,是:
max
查询显示当前正在使用的所有源之间的最大延迟,从而删除不再存在的源中的数据。
答案 0 :(得分:0)
您可以使用名为up
的自动生成的指标来将您所需的指标与其他指标隔离开。您可以轻松确定哪些度量标准源已从up
度量标准脱机。
up {job =“”,instance =“”}: 1,如果实例运行状况良好,即可以到达, 或0,如果刮擦失败。