我一直在找一个小时左右。我以为我在这里看过东西,但找不到。
我正在寻找nagios.log的记录定义。具体来说,我试图弄清楚数字代表什么。在此条目中,我想了解“ 1”是什么。
[1549377065]服务警告:esgg; HTTP; CRITICAL; SOFT; 1; CRITICAL-套接字超时
我以为这肯定很容易找到,但是我错了或者只是迷路了。
答案 0 :(得分:2)
它与Nagios中的soft&hard机制有关。
例如,如果您的服务esgg
在服务定义中设置了max_check_attempts 3
,那么您将看到以下内容:
[1549377065] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;1;CRITICAL - Socket timeout
[1549377195] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;2;CRITICAL - Socket timeout
[1549377265] SERVICE ALERT: esgg;HTTP;CRITICAL;HARD;3;CRITICAL - Socket timeout
您需要进行3次错误的连续检查才能获得HARD状态和通知。
答案 1 :(得分:0)
在Nagios服务定义中,已设置“检查间隔”,“重试间隔”和“最大检查尝试次数”。换句话说,nagios将每check interval
分钟检查一次服务,然后,如果运行不正常,它将每retry interval
分钟再次检查一次服务,max check attempts
次。您所指的号码是Nagios自进入“非正常”状态以来检查该服务的次数。它将递增直到达到max check attempts
或返回到OK状态。