集群自动缩放指标的Prometheus警报规则

时间:2020-09-13 18:00:06

标签: kubernetes prometheus-operator

我想为以下情况创建一个普罗米修斯警报规则,

Max capacity reached for the cluster

Unusual Scaling activity

我认为“群集达到的最大容量”可以通过结合以下指标来获得,

1.cluster_autoscaler_unscheulable_pods_count >0

2. sum(cluster_autoscaler_unneeded_nodes_count)==0

并且,“异常扩展活动”可以从sum(cluster_autoscaler_scaled_up_nodes_total)中获得

我已为Cluster autoscaler启用了度量标准,但是我不确定如何使用这些度量标准创建prometheus规则表达式,是否应该创建任何服务监视器?如何为上述方案结合这些指标?您是否已经有用于群集自动缩放器指标的Prometheus规则示例?

0 个答案:

没有答案