我们刚刚将Nagios从3.5.x更新到当前版本(4.0.7),随后添加了一个新主机进行监控。
新主机在Nagios中显示为'Down',这似乎与pnp4nagios没有记录性能数据这一事实有关(用户的个别检查,http等都可以找到)。
最初目录
时出错/usr/local/pnp4nagios/var/perfdata/newhost.com
包含新主机的xml设置和rrd文件丢失了),所以我手动创建了这个目录,但现在却抱怨文件丢失了。
有谁知道克服此问题的适当步骤?
谢谢,
托比
PS我会标记这个'pnp4nagios',但该标签不存在而且我无法创建它们
更新 pnp4nagios可能是红鲱鱼/症状。仔细观察,我发现Nagios实际上认为主机已关闭,即使所有服务都已启动。主机状态信息是'(主机检查在30.01秒后超时)'......这样做有什么意义吗?
答案 0 :(得分:1)
pnp4nagios确实不太可能与您的主机关闭有关。 pnp实际上导出输出和性能数据以提供rrd数据库和xml文件(通过npcd模块或evenhandler命令)。
nagios报告主机检查在30秒后超时意味着:
- 您的主机检查命令有问题,请仔细检查语法
- 此检查命令在特定时间间隔后超时(很可能在nagios.conf中定义)因为插件仍在运行。
我建议从服务器的提示符下运行此命令。你想做类似的事情:
/path/to/libexec/check_command -H ipaddress -args
例如:
/usr/local/libexec/nagios/check_ping -H 192.168.1.1 -w 200,40% -c 500,80% -timeout 120
看看有什么东西可能会悬挂。输出会有所帮助。
一旦你的主机检查将正确的输出和性能数据返回给nagios,pnp将希望完成其余的工作。
答案 1 :(得分:0)
在不太可能发生的情况下它对任何人都有帮助,pnp4nagios确实是一只红鲱鱼。问题是没有为正在检查的主机启用ping,这是对主机是否启动的测试。因此,尽管据报道其他服务正在发挥作用,但这种情况仍然失败。