不要使用promQL显示来自Grafana中重新部署的pod的数据

时间:2019-08-09 10:16:54

标签: grafana prometheus promql

我有一个PromQL查询,它查看每个分位数的最大延迟,并在Grafana中显示数据,但它显示了已重新部署且不再存在的Pod中的数据。吊舱比15天的陈旧时期还年轻。

以下是查询:max(latency{quantile="..."})

发现的最大等待时间是从调节开始到重新部署并恢复正常后不久,现在我只想看看当前设备的最大等待时间。

到目前为止,我发现的所有有关陈旧性的信息都应该在幕后进行过滤,但是看起来好像不是在当前设置中正在发生,所以我不知道该怎么做。

在查询中手动添加特定的实例ID时-它可以很好地工作,但是一旦重新部署ID,它就会更改:max(latency{quantile="...", exported_instance="ID"})

以下是我发现的类似问题的一长串,有的未得到回答,有的未要求相同。我确实发现的想法有些相关,但不能以可持续的方式解决问题,是:

以下链接中的建议没有帮助

  • 更改失效期,因为它会影响整个系统,所以将无效
  • 重新启动Prometheus,将无法正常工作,因为无法在每次重新部署pod时完成
  • 列出每台计算机的每个图形,不适用于max查询

链接到类似问题

最终目标

显示当前正在使用的所有源之间的最大延迟,从而删除不再存在的源中的数据。

1 个答案:

答案 0 :(得分:0)

您可以使用名为up的自动生成的指标来将您所需的指标与其他指标隔离开。您可以轻松确定哪些度量标准源已从up度量标准脱机。

  

up {job =“”,instance =“”}:   1,如果实例运行状况良好,即可以到达,   或0,如果刮擦失败。