我熟练地使用了普罗米修斯plugin。
它按照广告的形式收集日志,对其进行解析,提取延迟并将其显示在/metrics
端点上,并将原始日志发送到我的聚合系统。
但是,我注意到某些延迟不会刷新其值:
web_latencies_summary{response_code="408",quantile="0.5"} 60.0
web_latencies_summary{response_code="408",quantile="0.9"} 60.496
web_latencies_summary{response_code="408",quantile="0.99"} 60.496
web_latencies_summary_sum{response_code="408"} 421.597
web_latencies_summary_count{response_code="408"} 7
我检查了日志,并且在24小时内没有任何408,但是/metrics
端点仍显示上面的值。这显然使我的指标偏离了很多。
可能出什么问题了?我相信大多数普罗米修斯客户在一段时间内都没有使用NaN取代了价值。在这种情况下不会发生。
任何建议都值得赞赏。