远程节点监控建议

时间:2012-08-29 05:52:50

标签: monitoring nagios ganglia

我正在寻找一种监控多个(至少50个)远程节点的解决方案。这些远程节点位于防火墙后面,因此我无法从中央服务器轮询信息。

连接需要来自节点 - >中央服务器。我之前使用过ganglia和nagios,但它们都来自Server->节点。感谢是否有人可以提供一些开源推荐。远程节点和中央服务器都是基于Linux的系统。

我想收集的指标是:

  1. 正常运行时间
  2. 运行状况监视器(如果节点未在可配置的时间内与服务器通信,请通过发送电子邮件发出警报)
  3. CPU /内存/网络/磁盘使用情况
  4. 进程监视器(例如apache或ssh)
  5. 像puppet这样的配置管理将是一个奖励,但却是一个很棒的功能。

7 个答案:

答案 0 :(得分:2)

我会考虑使用NSCA或NRDP对Nagios进行被动检查。这两种方法都可以将结果从远程计算机推送到中央服务器。

http://nagios.sourceforge.net/docs/3_0/passivechecks.html

或者您可以使用NRDP,它通过标准的http和https协议进行通信。 http://assets.nagios.com/downloads/nagiosxi/docs/NRDP_Overview.pdf

一旦你用其中任何一个设置了一个系统,用puppet甚至rsync克隆设置就不难了。

答案 1 :(得分:1)

如果你可以为该网络上的单个主机戳一个防火墙漏洞(tcp / 5666),你可以将该主机用作一种“NRPE网关”。

然后你可以使用check_nrpe让 主机对防火墙后面的其他50个左右的节点进行所有检查(包括将check_nrpe链接在一起进行“内部”检查)。

如果你选择这条路线,请确保所有这些服务的服务依赖性(考虑使用服务组)依赖于“网关”上的NRPE。

答案 2 :(得分:1)

如果您可以访问防火墙后面的单个服务器,则可以使用Mod-Gearman对该远程主机上的特定主机组运行检查。

答案 3 :(得分:1)

  1. 如果防火墙允许HTTP(S),您可以尝试使用Nagira API(RESTful)提交被动检查。 有几个使用它实现的设置示例。 请查看http://dmytro.github.com/nagira

  2. 或者,您可以使用相同的API来轮询客户端。如果您的防火墙允许传出HTTP(S)。

答案 4 :(得分:0)

现在回答这个问题可能有点太晚了。 但是,

  1. 一台nodeJs服务器,在每台机器上实现一组集群节点(更好地控制目标机器,以便采取正确的措施,而不仅仅是监控。),需要进行监控。
  2. 单个nodejs服务器接收来自多个节点的输入,这些节点通过html文档中的socket.io等库进行简单连接。
  3. 干杯。

答案 5 :(得分:0)

您可以使用Pandora FMS监控此服务器。为此,您可以在每台计算机上安装软件代理,在防火墙中为触手协议配置一个exeption,并将信息发送回Pandora Server。您可以使用本地模块监控上面提到的所有参数。对于puppet,有一篇特定的文章写在pandora fms博客网站上,在那里你可以逐步阅读有关如何监控木偶的信息。有关pandora fms的更多信息,您可以访问以下网站:Pandora FMS Unified Monitoring TooL

此致 Ivo Yordanov

答案 6 :(得分:0)

查看 Uptime ,这是一个用Node.js和MongoDB编写的开源远程监控工具:https://github.com/fzaninotto/uptime。可能非常适合您的需要。