我有一个连接到ALB的ECS EC2服务,正在运行3个任务。
“健康检查宽限期”设置为7200秒,可能需要一个多小时才能启动。
部署是通过“云形成”完成的,它会使用新的ECR映像更新任务定义。
这会触发在ECS上的部署,并成功停止一个旧任务并启动一个新任务。但是,在5分钟后,即使ALB仍将实例报告为不正常,ECS仍将继续部署,停止所有旧任务,并在第一个新任务运行良好之前启动新任务。
这将导致ALB没有可用实例并且出现故障。
我怀疑这是因为ECS并没有真正与ALB对话,只是因为ALB将终止任务。
我看过使用“任务定义运行状况检查”,但它的startPeriod或宽限期仅为300秒。
这里有什么明显的我想念的吗?