Question

我使用NRPE插件为Nagios Monitoring Server配置一个Linux主机。为此，我按照以下网址

http://www.tecmint.com/how-to-add-linux-host-to-nagios-monitoring-server/

我必须检查Linux Host的一些服务。为了监控该主机的linux主机和服务，我使用的是nagios log（/usr/local/nagios/var/nagios.log）

第一次在我的nagios日志中表现良好，显示我身份如下

SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK

当我的服务状态更改为非正常状态时，而不是在日志中显示我

SERVICE ALERT: test.testing.local;Service Tomcat;CRITICAL;SOFT;4;TOMCAT CRITICAL

但我想要的是，如果我的服务状态没有变为非OK状态，而是在1分钟之后再显示我的日志

SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK

目前尚未发生。

我的services.cfg文件内容如下所示

define service {
    host_name                       test.testing.local
    service_description             Service Tomcat
    check_command                   check_nrpe!check_service_tomcat
    max_check_attempts              10
    check_interval                  1
    retry_interval                  1
    active_checks_enabled           1
    check_period                    24x7
    register                        1
}

我正在使用Nagios 4.2.2和CentOS 7。

Answer 1

我认为你所追求的是来自Nagios 4 Core的文档here

check_interval：该指令用于定义＆＃34;时间单位的数量＆＃34;在定期检查主机之间。除非您已将interval_length指令从默认值60更改，否则此数字将表示分钟。有关此值的更多信息，请参阅检查计划文档。

retry_interval：该指令用于定义＆＃34;时间的数量    单元＆＃34;在安排重新检查主机之前等待。主持人是    当他们更改为非UP时，在重试间隔重新安排    州。一旦主机重试了max_check_attemp次而没有    如果状态发生变化，它将恢复到原来的状态    ＆＃34;正常＆＃34; check_interval值定义的速率。除非你有    将interval_length指令从默认值60更改为    这个数字意味着分钟。有关此值的更多信息可以是    在检查计划文档中找到。

如果您将check_interval设置为1分钟（这是非常频繁的，默认情况下，您可以看到为60），您将每隔1分钟重试 10次（配置中的max_check_attempts）如果状态发生变化，它会给你一个OK / UP状态。

当Nagios处于OK或UP状态时，Nagios重试间隔

1 个答案: