使用普罗米修斯测量服务延迟

时间:2017-11-15 10:48:51

标签: monitoring latency grafana summary prometheus

我是prometheus和grafana的新手......

我的主要目标是获得每个请求的响应时间。

对我而言,这似乎是一件简单的事情 - 但无论我做什么,我都无法得到我需要的结果。

我需要能够在最后几分钟/小时/天内分析服务等级。 我发现的当前实现是一个简单的SUMMARY(没有分位数的定义),它每15秒被删除一次。

  1. 是否有可能从我的prometheus摘要中获得最后一分钟的平均请求延迟?
  2. 如果是:如何?如果否:我该怎么办?
  3. 目前我使用以下查询:

    rate(http_response_time_sum{application="myapp",handler="myHandler", status="200"}[1m])
    /
    rate(http_response_time_count{application="myapp",handler="myHandler", status="200"}[1m])
    

    我得到两个"数据集"。第一个的值是" NaN"。 我想这是adivision by zero的结果。

    提前THX!

    (使用spring-client)

1 个答案:

答案 0 :(得分:3)

您的查询是正确的。如果过去一分钟没有查询,结果将是NaN。