我设置了闹钟,告诉我何时我的负载均衡器使用HTTPCode_Backend_5XX
指标和sum
统计信息投掷5xxs。问题是sum
将0注册为无数据点,因此当没有引发5xx时,警报被视为数据不足。这特别令人沮丧,因为我有SNS设置,每当我们得到太多的5xx(警报状态)以及每当事情恢复正常时通知我。令人讨厌的是,0 5xx意味着我们处于INSUFFICIENT DATA
状态,但是1 5xx意味着我们处于OK
状态,因此1 5xx会触发每个人收到通知即可。有没有办法解决?理想情况下,我希望只有0表示零数据点,而不是根本没有数据(数据不足)。
答案 0 :(得分:14)
答案 1 :(得分:3)
我们的一些警报也有类似的问题。如果你真的想要处理开销,你可以通过一些工作来避免这种行为。
我们所做的不是直接向电子邮件发送SNS通知,而是创建了一个lambda函数,并在SNS主题中收到通知后触发它。
这样,您可以更好地控制触发警报后可以执行的操作。因为上下文将为您提供旧的州价值。
好消息是,已经有一个lambda模板可以开始了。 https://aws.amazon.com/blogs/aws/new-slack-integration-blueprints-for-aws-lambda/
选择一个旨在发送云计算警报的设备。然后,您可以根据需要修改代码,或者忽略松弛部分,只使用电子邮件,或者保持松弛。 (这就是我们所做的,它就像一个魅力)
答案 2 :(得分:1)
两年前我在AWS论坛中提到过这个问题:-( https://forums.aws.amazon.com/thread.jspa?threadID=153753&tstart=0
不幸的是,您无法根据特定的状态更改创建通知(在您的情况下,当状态从ALARM更改为OK时,您需要通知,但是当状态从INSUFFICIENT更改为OK时则不需要通知)。我只能建议你也要求它,并希望它最终会被添加。
对于通常处于INSUFFICIENT状态的指标,我通常只为ALARMS创建通知,而我没有关于这些指标的通知 - 如果我想确认一切正常我使用AWS移动应用程序检查事情,看看他们是否已经解决。