我们的EC2实例将每15-20分钟不响应,之后我必须在EBS仪表板上使用以下信息重新启动应用程序服务器:
- 没有从实例接收数据。最近一次看到是在10分钟前。
- 实例EBS的运行状况为“ OutOfService”达62秒:实例至少连续失败了运行状况检查的UnhealthyThreshold数量。
- 所有实例均未发送数据。
- EBS运行状况失败或不适用于所有实例。
我们观察到以下指标:
- 环境卫生-严重
- 平均延迟-60秒钟以上
- 总请求数-150-200 /分钟
- CPU使用率-20-40%
- 数据库连接-6-8
- 数据库CPU使用率-2%
我尝试过的几件事-
1.尝试与安全组织一起玩,还没有运气。而且,慢速查询日志看起来很正常。
2.无法SSH或直接访问EC2。