当Nagios处于OK或UP状态时,Nagios重试间隔

时间:2016-12-11 13:04:55

标签: centos nagios nrpe nagiosxi

我使用NRPE插件为Nagios Monitoring Server配置一个Linux主机。 为此,我按照以下网址

http://www.tecmint.com/how-to-add-linux-host-to-nagios-monitoring-server/

我必须检查Linux Host的一些服务。 为了监控该主机的linux主机和服务,我使用的是nagios log(/usr/local/nagios/var/nagios.log

第一次在我的nagios日志中表现良好,显示我身份如下

SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK

当我的服务状态更改为非正常状态时,而不是在日志中显示我

SERVICE ALERT: test.testing.local;Service Tomcat;CRITICAL;SOFT;4;TOMCAT CRITICAL

但我想要的是,如果我的服务状态没有变为非OK状态,而是在1分钟之后再显示我的日志

SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK

目前尚未发生。

我的services.cfg文件内容如下所示

define service {
    host_name                       test.testing.local
    service_description             Service Tomcat
    check_command                   check_nrpe!check_service_tomcat
    max_check_attempts              10
    check_interval                  1
    retry_interval                  1
    active_checks_enabled           1
    check_period                    24x7
    register                        1
}

我正在使用Nagios 4.2.2和CentOS 7。

1 个答案:

答案 0 :(得分:1)

我认为你所追求的是来自Nagios 4 Core的文档here

  

check_interval:该指令用于定义"时间单位的数量"在定期检查主机之间。除非您已将interval_length指令从默认值60更改,否则此数字将表示分钟。有关此值的更多信息,请参阅检查计划文档。

     

retry_interval:该指令用于定义"时间的数量    单元"在安排重新检查主机之前等待。主持人是    当他们更改为非UP时,在重试间隔重新安排    州。一旦主机重试了max_check_attemp次而没有    如果状态发生变化,它将恢复到原来的状态    "正常" check_interval值定义的速率。除非你有    将interval_length指令从默认值60更改为    这个数字意味着分钟。有关此值的更多信息可以是    在检查计划文档中找到。

如果您将check_interval设置为1分钟(这是非常频繁的,默认情况下,您可以看到为60),您将每隔1分钟重试 10次(配置中的max_check_attempts)如果状态发生变化,它会给你一个OK / UP状态。