我在受监控的公共互联网主机上获得了大量服务。主机不可ping,因此我使用带有标准服务检查的无检查主机定义。
为了获得智能通知,在上游网络关闭时阻止通知,我已根据需要为所有主机设置了父级。这正确地映射出来,但是当路由器出现故障并取出下游服务时,我仍然充斥着警报。
Nagios === RouterHostA === RouterHostB ===没有Ping主机w / services。
当RouterHostB关闭时,我需要做什么来阻止服务通知。我认为问题是没有检查的主机熬夜,但我认为当父路由器出现故障时,Nagios会停止对主机及其服务的所有检查。
每次我遇到200问题然后再收到200条已恢复的短信时,它就会导致我死亡。
答案 0 :(得分:0)
怀疑问题是没有ping / check主机保持运行,因此服务检查会发出通知。必须让主机检查失败并显示主机已关闭。我能够通过check_tcp到服务的端口来做到这一点。这是
define host{
host_name No Ping Host
alias www.xyz.tld
address www.xyz.tld
check_command check_tcp!443
parents RouterHostB
}
define service{
use generic-service
host_name No Ping Host
service_description HTTPS_URL
check_command check_https_url!/index.html!serialnumber!
}
这不是理想的,但它似乎是最好的选择。