在Nagios长期服务检查

时间:2013-04-22 19:59:33

标签: linux nagios

我有一个服务检查,我在Nagios Exchange网站上找到了适用于小目录的服务检查,但不适合需要超过30或60秒才能完成的大型目录。

http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/CheckDirSize/details

我遇到的问题是我需要配置一项服务检查,Nagios每天可以运行一次但是会保持打开1440分钟(一天)。目录列表非常庞大,需要花费数小时才能完成(最多20小时)。

这是我的服务检查(每天检查,当使用nrpe时,超时是86400秒,这也是一天)。但由于某种原因,即使我可以在ps -ef |中看到du -sk在命令行上运行grep du,Nagios报告"(服务检查超时)":

define service {
    use                             generic-service,srv-pnp
    host_name                       IMAGEServer1
    service_description             Images
    check_command                   check_nrpe!check_dirsize -t 86400
    check_interval                  1440
    }

在我的linux服务器上的nrpe.cfg文件中,我也有这两个指令:

command_timeout=86400
connection_timeout=86400

如何让Nagios完成支票而不是超时?我的印象是我的上述指示是正确的。

1 个答案:

答案 0 :(得分:1)

什么是超时是本地check_nrpe命令(默认超时为2分钟)。您可以编辑其命令定义以使用长超时。

或者,您可能希望将此作为IMAGEServer1的被动检查,作为cron作业运行。