我将CloudWatch警报设置为在内存预留大于70%时向EC2自动扩展组添加1个容量单位。警报是在正确的时刻触发的,但是此后警报已超过16小时以上,而EC2自动缩放组中根本没有任何变化。可能出什么问题了?
这是我的ECS CloudFormation模板:
2019-12-26 11:40:54 Action Successfully executed action arn:aws:autoscaling:ap-southeast-2:031539715286:scalingPolicy:95e836b6-2f56-498d-b931-7ec4184bedc4:autoScalingGroupName/ECS-UEBZA8GAP8S7-ECSAutoScalingGroup-1BIBTJH5I50W9:policyName/ECS-UEBZA8GAP8S7-ScaleUpPolicy-17LUWE42DC7EO
2019-12-26 11:40:54 State update Alarm updated from OK to In alarm
警报活动历史记录:
import tweepy
import re
import csv
import json
import got
auth = tweepy.OAuthHandler("APIKEY","APISCRETKEY")
auth.set_access_token("ACCESS-TOKEN","ACESS-TOKEN-SCRETKEY")
api = tweepy.API(auth,wait_on_rate_limit=True)
答案 0 :(得分:1)
确保没有任何进程挂起。警报通知意味着传入的警报不会触发缩放策略。发射意味着即使期望上升,也不会发射任何东西
可能导致此问题的其他常见问题:
如果您正在使用权重并将期望值增加1,但最低权重不是1,则可能永远无法缩放。
确保没有触发其他任何可覆盖此扩展策略的扩展策略
检查活动历史记录,以确保没有持续进行任何健康检查替换,因为这将启动5分钟的冷却时间(默认情况,因为没有在ASG上设置,只有缩放策略),并且会阻止简单的扩展政策
确保所需的不是最大数量
除了触发警报外,请确保在警报历史记录中看到发生了自动缩放的“操作”(该操作实际上在警报保持在“警报”状态的每一分钟都发生,没有其他评估设置,但只有第一个发布到“警报”历史记录中)
检查ASG活动历史记录是否存在启动失败,这在使用竞价型实例时尤其常见,并且在发生足够的失败后,ASG最终将进入退避状态。对该群组进行的任何手动更新都会重置此补偿
答案 1 :(得分:0)
您是否指定了“ ActionsEnabled = True”?