我使用NRPE插件为Nagios Monitoring Server配置一个Linux主机。 为此,我按照以下网址
http://www.tecmint.com/how-to-add-linux-host-to-nagios-monitoring-server/
我必须检查Linux Host的一些服务。
为了监控该主机的linux主机和服务,我使用的是nagios log(/usr/local/nagios/var/nagios.log
)
第一次在我的nagios日志中表现良好,显示我身份如下
SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK
当我的服务状态更改为非正常状态时,而不是在日志中显示我
SERVICE ALERT: test.testing.local;Service Tomcat;CRITICAL;SOFT;4;TOMCAT CRITICAL
但我想要的是,如果我的服务状态没有变为非OK状态,而是在1分钟之后再显示我的日志
SERVICE ALERT: test.testing.local;Service Tomcat;OK;SOFT;6;TOMCAT OK
目前尚未发生。
我的services.cfg文件内容如下所示
define service {
host_name test.testing.local
service_description Service Tomcat
check_command check_nrpe!check_service_tomcat
max_check_attempts 10
check_interval 1
retry_interval 1
active_checks_enabled 1
check_period 24x7
register 1
}
我正在使用Nagios 4.2.2和CentOS 7。
答案 0 :(得分:1)
我认为你所追求的是来自Nagios 4 Core的文档here
check_interval:该指令用于定义"时间单位的数量"在定期检查主机之间。除非您已将interval_length指令从默认值60更改,否则此数字将表示分钟。有关此值的更多信息,请参阅检查计划文档。
retry_interval:该指令用于定义"时间的数量 单元"在安排重新检查主机之前等待。主持人是 当他们更改为非UP时,在重试间隔重新安排 州。一旦主机重试了max_check_attemp次而没有 如果状态发生变化,它将恢复到原来的状态 "正常" check_interval值定义的速率。除非你有 将interval_length指令从默认值60更改为 这个数字意味着分钟。有关此值的更多信息可以是 在检查计划文档中找到。
如果您将check_interval设置为1分钟(这是非常频繁的,默认情况下,您可以看到为60),您将每隔1分钟重试 10次(配置中的max_check_attempts)如果状态发生变化,它会给你一个OK / UP状态。