我不熟悉xymon故障排除,通常支持xymon的人正在休假。所以我需要一个或两个指针来查找问题。
我们有一台xymon ver 4.3.26服务器,通常监控大约1400个系统。我们昨晚修补了大约200个系统,毕竟说完了,其中大约34个系统在“所有非绿色”页面上显示为紫色。
之前发生了这种情况,xymon服务器将在一段时间后“赶上”。然而,12小时后,这34个仍然在所有测试中显示为紫色。
我已经尝试在客户端上重新启动xymon服务,当它没有产生结果时,重新启动服务器上的服务 - 仍然没有效果。
我在/ var / logs / xymon下找到了日志;但是,那些看起来没什么不好的东西。关于来自无关主机的乱码消息的一些条目显然一直在继续与此问题无关。
所以,一个简短的问题还有很长的路要走:我怎样才能找出客户无法报告的原因?有没有办法测试连接或其他显示连接问题的日志?
答案 0 :(得分:1)
经过多次探讨,我终于找到了/var/lib/xymon/tmp/xymond.chk。
重置所有状态。不得不回去重新禁用一些测试,但一切都恢复了。我有一种感觉,我把一个小的热核设备带到了苍蝇;但是,苍蝇死了,所以......