正如问题所述,有没有办法监控ECS何时不断注册和取消注册实例,因为某些错误导致我的实例崩溃?如果是这种情况,我希望能够制作警报或通知我的事情。
答案 0 :(得分:0)
我无法发表评论,所以这里有一些想法。
我将在Auto-Scaling组下运行ECS集群EC2实例,并基于ASG CloudWatch指标,在添加/删除实例时设置SNS通知。
我们还可以将AWS ecs-agent docker容器日志也发送到CloudWatch,并基于错误或已过滤的事件获取一些SNS通知。
在启动/停止每个服务任务时,我们也可以从ECS订阅CW。 参考- https://docs.aws.amazon.com/AmazonECS/latest/developerguide/cloudwatch_event_stream.html https://docs.aws.amazon.com/AmazonECS/latest/developerguide/ecs_cwet.html
示例事件条目位于下面的链接中– https://docs.aws.amazon.com/AmazonECS/latest/developerguide/ecs_cwe_events.html
有关基于自定义指标设置警报的参考。
也请让我知道您的想法:)。