普罗米修斯查询连续正常运行时间

时间:2019-03-02 19:49:56

标签: metrics prometheus continuous

我是普罗米修斯(Prometheus)的新手,一直在努力找出正确的查询,以获取服务的最新连续正常运行时间。

例如,如果当前时间是0:01:20,我的服务在0:00:00启用,则在0:01:01停用,然后在0:01:10再次启用,我想看到“ 10秒”的正常运行时间。

我主要查看“ up {}”指标,并可能将其与函数(changes(),rate()等)结合使用,但到目前为止还没有运气。我也看不到任何其他类似于“向上”的普罗米修斯度量。

1 个答案:

答案 0 :(得分:1)

问题是您需要一些信息来告诉您服务何时真正启动以及节点是否启动:)
我们使用以下内容(希望对您有所帮助或对每个概念都有帮助):
1.查看主机时,我们使用node_time{...} - node_boot_time{...}
2.当我们查看特定的进程/容器(在本例中为通过cadvisor的docker)时,我们使用node_time{...} - on(instance) group_right container_start_time_seconds{name=~"..."}) by(name,instance)