AWS随机不正常实例

时间:2019-05-23 03:14:02

标签: amazon-web-services amazon-ec2 health-monitoring

我的目标组可容纳3-4台服务器

从本周开始,我们开始看到间歇性的不健康警报

enter image description here

大多数情况下仅发生1次且非常短(1-2分钟) 知道为什么会这样吗?我应该从哪里开始检查出什么问题了?我可以确认不健康事件发生时我的应用程序没有崩溃

1 个答案:

答案 0 :(得分:0)

指标仅表明运行状况检查失败。

您可以配置运行状况检查:

  • 多久检查一次
  • 多少次故障应导致“不健康”
  • 多少次失败会导致“健康”(失败后)

如果您发现即使实例被标记为不正常,它们仍然可以正常工作,那么您可能希望增加检查间隔,或者增加将实例标记为不正常所需的检查次数。

但是,您实际上应该首先调查应用程序是否正确响应以及可能导致运行状况检查失败的原因。您可以为>0 Unhealthy instances设置警报,以通知您何时进行调查。