未能将munin节点添加到监控中

时间:2015-12-01 06:39:24

标签: munin

我试图在munin设置一些新主机进行监控。由于某种原因它不会发生!

这是我迄今为止所尝试的内容。

在已经监控其他几台主机的munin服务器上,我已经在/etc/munin/munin.conf中添加了我想要的主机

[db1]
    address   10.10.10.25 # <- obscured the real IP address 
    use_node_name yes

在db1主机上我在/etc/munin/munin-node.conf中设置了这个

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

我确保在两台机器上重启服务。

从监控主机我可以telnet到我想在munin端口上监控的新服务器:

[root@monitor3:~] #telnet db1.example.com 4949
Trying 10.10.10.26...
Connected to db1.example.com.
Escape character is '^]'.
# munin node at db1.example.com

等几分钟......什么都没有!新服务器不会出现在munin监控主机的munin仪表板中。

在db1主机(我试图监控的那个)上的/var/log/munin/munin-update.log日志中,我发现了这个:

2015/11/30 03:20:02 [INFO] starting work in 14199 for db1/10.10.10.26:4949.

2015/11/30 03:20:02 [FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

2015/11/30 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

这可能会发生什么?我该如何解决这个问题?

1 个答案:

答案 0 :(得分:2)

由于您已经确认您的网络连接正常,因此作为调查的第一步,我肯定会简化munin-node.conf。目前你有:

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

从这些我会删除:

  • host_name(可能是多余的。)
  • IPv6环回地址。 (我认为你不需要它,但如果你确实需要它可以稍后再添加它)
  • IPv4环回地址。 (与上述相同)

如果仍然无效,您可以通过将直接IP替换为allow配置来完全解决任何问题:

cidr_allow 10.10.10.0/24

如果您的db1主机似乎是从不同的IP连接,这将允许从全系列IP连接。