我的目标组可容纳3-4台服务器
从本周开始,我们开始看到间歇性的不健康警报
大多数情况下仅发生1次且非常短(1-2分钟) 知道为什么会这样吗?我应该从哪里开始检查出什么问题了?我可以确认不健康事件发生时我的应用程序没有崩溃
答案 0 :(得分:0)
指标仅表明运行状况检查失败。
您可以配置运行状况检查:
如果您发现即使实例被标记为不正常,它们仍然可以正常工作,那么您可能希望增加检查间隔,或者增加将实例标记为不正常所需的检查次数。
但是,您实际上应该首先调查应用程序是否正确响应以及可能导致运行状况检查失败的原因。您可以为>0 Unhealthy instances
设置警报,以通知您何时进行调查。