Question

我有一个带触发器的自动缩放组，如下所示：

Average CPU Utliziation > 90% scale up 1 instance
Average CPU Utilization < 25% scale down 1 instance

该指标每2分钟计算一次，违规限制为10分钟。

我遇到的问题是触发器似乎不断被触发。每10分钟创建和销毁一次实例。我一直在监视CPU利用率，它永远不会超过扩展阈值。它击中的最大值约为80％，这只发生过一次，大部分时间都在20％到25％的范围内。我只有1个实例正常运行，但eveyr 10分钟ELB将创建一个新实例，很快就会终止它。

我在这里做错了什么？我不明白平均CPU利用率如何运作？

Monitor of Average CPU Utilization

Answer 1

新的EC2实例由Auto-Scaling（非Load Balancer）创建。

Auto Scaling组中有一个“Scaling History”标签，可能会提供一些关于触发横向扩展策略的提示。

检查Auto Scaling组和/或Launch Configuration是否启用了“Detailed Monitoring” - 这将导致每1分钟收集一次指标（例如CPU），而不是默认的5分钟。

检查CloudWatch图表上的设置以匹配指标收集时间间隔 - 如果每分钟收集指标，则还将CloudWatch图表设置为1分钟。否则，您可能会以低于警报本身的“分辨率”查看指标。

最坏的情况是，增加闹钟的时间设置，例如“连续2个时段超过90％”，而不是仅仅一个时段。