PromQL:确定在时间范围内不断上升的指标

时间:2020-06-24 02:58:08

标签: prometheus prometheus-alertmanager promql

这将监视卡夫卡的滞后,有时消费者会卡住而不会出现错误。

这里,我们想...如果某些“消费者组,主题”的滞后持续增加20m(20个样本),则应该发出警告,这意味着在此期间,相邻样本要么上升,要么均匀。

是否可以在promql中定义此触发器?

元素示例:

kafka_consumergroup_lag{consumergroup="order-beta",endpoint="http",instance="172.20.58.226:9308",job="kafka-exporter",namespace="monitoring",partition="0",pod="kafka-exporter-885fbcb9f-g9ktq",service="kafka-exporter",topic="health.check"}

1 个答案:

答案 0 :(得分:0)

尝试使用offset modifier。例如,当kafka_consumergroup_lag的当前值超过20分钟前的值时,以下PromQL查询将返回非空结果:

kafka_consumergroup_lag > kafka_consumergroup_lag offset 20m

尝试在Prometheus警报中使用此查询。