我试图在munin设置一些新主机进行监控。由于某种原因它不会发生!
这是我迄今为止所尝试的内容。
在已经监控其他几台主机的munin服务器上,我已经在/etc/munin/munin.conf中添加了我想要的主机
[db1]
address 10.10.10.25 # <- obscured the real IP address
use_node_name yes
在db1主机上我在/etc/munin/munin-node.conf中设置了这个
host_name db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949
我确保在两台机器上重启服务。
从监控主机我可以telnet到我想在munin端口上监控的新服务器:
[root@monitor3:~] #telnet db1.example.com 4949
Trying 10.10.10.26...
Connected to db1.example.com.
Escape character is '^]'.
# munin node at db1.example.com
等几分钟......什么都没有!新服务器不会出现在munin监控主机的munin仪表板中。
在db1主机(我试图监控的那个)上的/var/log/munin/munin-update.log日志中,我发现了这个:
2015/11/30 03:20:02 [INFO] starting work in 14199 for db1/10.10.10.26:4949.
2015/11/30 03:20:02 [FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.
2015/11/30 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.
这可能会发生什么?我该如何解决这个问题?
答案 0 :(得分:2)
由于您已经确认您的网络连接正常,因此作为调查的第一步,我肯定会简化munin-node.conf
。目前你有:
host_name db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949
从这些我会删除:
host_name
(可能是多余的。)如果仍然无效,您可以通过将直接IP替换为allow
配置来完全解决任何问题:
cidr_allow 10.10.10.0/24
如果您的db1主机似乎是从不同的IP连接,这将允许从全系列IP连接。