我有一个带触发器的自动缩放组,如下所示:
Average CPU Utliziation > 90% scale up 1 instance
Average CPU Utilization < 25% scale down 1 instance
该指标每2分钟计算一次,违规限制为10分钟。
我遇到的问题是触发器似乎不断被触发。每10分钟创建和销毁一次实例。我一直在监视CPU利用率,它永远不会超过扩展阈值。它击中的最大值约为80%,这只发生过一次,大部分时间都在20%到25%的范围内。我只有1个实例正常运行,但eveyr 10分钟ELB将创建一个新实例,很快就会终止它。
我在这里做错了什么?我不明白平均CPU利用率如何运作?
答案 0 :(得分:2)
新的EC2实例由Auto-Scaling(非Load Balancer)创建。
Auto Scaling组中有一个“Scaling History”标签,可能会提供一些关于触发横向扩展策略的提示。
检查Auto Scaling组和/或Launch Configuration是否启用了“Detailed Monitoring” - 这将导致每1分钟收集一次指标(例如CPU),而不是默认的5分钟。
检查CloudWatch图表上的设置以匹配指标收集时间间隔 - 如果每分钟收集指标,则还将CloudWatch图表设置为1分钟。否则,您可能会以低于警报本身的“分辨率”查看指标。
最坏的情况是,增加闹钟的时间设置,例如“连续2个时段超过90%”,而不是仅仅一个时段。