zabbix中的同一触发警报停止

时间:2016-12-25 07:25:23

标签: zabbix

我使用的是Zabbix 3.2;我为所有触发器配置了邮件警报操作。我的问题是, 假设触发(A)警报(问题事件)升级并在几分钟后恢复正常(Ok事件警报)。我需要停止提醒,如果相同的话,A' A'触发器发生在接下来的几分钟内。怎么可能? 我试过这个文档; Beginning Reading Transaction Log

1 个答案:

答案 0 :(得分:1)

问题似乎是防止触发器抖动。通常,建议使用三种方法:

  • 使用trigger functions - 例如,代替last()使用avg(15m) - 然后仅在15分钟的平均值超过阈值后才会发出警报。其他有用的触发器功能可能是min()max()
  • 使用滞后 - 这会使触发器在一个阈值处触发但在另一个阈值上解析。在Zabbix 3.2完成之前in the trigger expression;因为Zabbix 3.2有一个separate "recovery" field
  • 使用action escalations一开始什么也不做,只在问题出现一段时间后发出警报 - 例如,在第二步或第三步发出警报

这三种方法都取得了类似的结果,但主要区别在于:

  • 第一种方法 - 触发器功能 - 使触发器稍后触发,但减少事件数量(触发器触发的次数)
  • 第二种方法 - 滞后 - 使触发器与“flappy”触发器同时触发,但延迟恢复事件。它还减少了事件的数量(触发时间触发)
  • 第三种方法 - 延迟升级步骤 - 根本不影响触发器,它可以继续振荡。但是,它只会在问题存在较长时间时发出警告。

当触发器翻转时,滞后通常会发出警报;延迟升级步骤将忽略短期问题。

复杂性方面,我通常采用第一种方法 - 它是最容易配置的,最难配置错误和最容易理解的方法。如果我特别需要它们使事件/警报行为的方式,那么我会选择其他两种方法中的一种 - 这些方法有更高的可能性被错误配置或误解。

请注意,注释中的项密钥引用是错误的 - 主机与冒号分隔,缺少完整的密钥名称且参数错误。有关正确的密钥语法,请参阅手册中的the agent key page