我正在使用monit和M/Monit来监控我的应用程序基础架构。但每隔一段时间,M / Monit就会从服务器显示“No report”错误并将其标记下来。几秒钟后,在下次检查服务器到M / Monit时,问题就会清除。
某些服务器上的监控日志中包含以下事件:
10月14日12:19:11 ip-10-203-51-199 monit [30307]:M / Monit:无法打开一个 与http://example.com:8080/collector的连接 - 连接超时 10月14日12:20:16 ip-10-203-51-199 monit [30307]:M / Monit:无法打开一个 与http://example.com:8080/collector的连接 - 连接超时 10月14日12:22:21 ip-10-203-51-199 monit [30307]:M / Monit:无法打开一个 与http://example.com:8080/collector的连接 - 连接超时
在M / Monit认为服务器实际关闭之前,我需要调整哪些配置来增加阈值?
以下是服务器中最麻烦的配置:
set httpd port 2812 and
allow xxx:xxx
set mailserver xxx.xxx.xxx port xxx username "xxx" password "xxx" using tlsv1 with timeout 15 seconds
set daemon 30
with start delay 120
set logfile syslog facility log_daemon
set alert xxx
set mail-format {
subject: $EVENT $SERVICE on $HOST
from: monit@$HOST
message: Monit $ACTION $SERVICE at $DATE on $HOST: $DESCRIPTION.
}
set mmonit http://xxx:xxx@example.com:8080/collector
答案 0 :(得分:1)
配置文件似乎没有任何问题。 您遇到的间歇性问题是因为monit无法打开端口上的套接字并超时。请参阅源代码以供参考(handle_mmonit()): http://fossies.org/linux/privat/monit-5.6.tar.gz:a/monit-5.6/src/collector.c
搜索字符串“M / Monit:无法打开连接”。
代码中的超时值似乎固定为5秒。但是5秒就足以在该端口上打开套接字连接。
monit会多久发布一次mmonit事件?
答案 1 :(得分:1)
有同样的问题
[MST Apr 5 11:24:11] error : 'apache' failed protocol test [APACHESTATUS] at [phoenix.example.com]:80 [TCP/IP] -- APACHE-STATUS: error -- no scoreboard found
[MST Apr 5 11:24:16] error : Cannot create socket to [10x.xx.xx.x4]:8080 -- Connection timed out
我们在iptables之上有另一个防火墙。在输入和输出侧打开8080并修复它!