在jvm统计信息上遇到Prometheus百分位数查询的问题

时间:2019-03-26 04:26:31

标签: prometheus

我正在编写一个查询,以获取jvm_gc_collection_seconds_count中变化率的第95个百分点。我想在出现意外峰值时触发警报。目的是在JVM比平时更努力工作时向我发送警报。

我正在使用jvm_memory_bytes_used进行测试,因为GC的速率目前未显示任何异常。以下是我从jvm_memory_bytes_used获取的数据的示例。前两个蓝色尖峰不应作为数据点返回吗?底部红色线一定会被拾取为异常。

sum of the rate of jvm_memory_bytes_used over 30 minutes

我已经根据实例对30分钟内的费用总和进行了计算。因此,我尝试获得第95个百分位。

histogram_quantile(0.95, sum(rate(jvm_memory_bytes_used[30m])) by (instance, le))

我尝试降低没有效果的百分比。

  1. 我使用正确的变量来计算GC统计信息吗?
  2. 如何获取histogram_quantile来产生结果?
  3. 我是否采用正确的方法使用百分位数实现目标?

0 个答案:

没有答案