我使用Application Insights的“可用性”功能来检查网站的可用性,并在网站出现故障时发送警报。 现在,Application Insights每5分钟发送一次警报,即使“ 警报失败时间窗口”为 15 分钟也是如此。测试频率为5分钟。
所以我会在5分钟后,10分钟后,15分钟后收到警报! 15分钟后,我只需要1个警报即可收到3个警报。对我来说似乎是个虫子。
答案 0 :(得分:1)
满足警报条件后即发送电子邮件(通知)。它不等待警报失败时间窗口。
示例:用于警报规则,如果5个位置中有3个变为红色,并且在第一秒内有3个变为红色=>将在同一秒内发送通知,以发送通知。它不会等待5(或15)分钟。
这是设计使然,目的是减少TTD(检测时间)。
有两种处理噪声的方法:
无论哪种方式-应该只发送一个通知,而不是每5/15分钟发送一次。多个通知提示跟踪警报当前状态的某些错误(产品中的错误)或间歇性失败的应用程序(因此,警报规则不断更改其状态,绿色=>红色=>绿色=> ...)每次转换期间都会发送电子邮件)。当测试一直为红色时,您每5分钟会收到警报吗?
警报失败时间窗口定义了失败位置的含义。 5分钟的测试间隔和5分钟的警报失败表示最后1个结果定义了位置是否失败。 5分钟的测试间隔和15分钟的警报失败表示最后3个结果定义了位置是否失败。因此,如果这3次测试运行之一失败,则定位被认为是失败的(即使可能成功后有2个结果)。
增加警报失败时间窗口将使警报规则更具攻击性(并且对间歇性失败的应用程序产生干扰)。