编写系统来监视集群中的所有节点

时间:2010-02-12 19:49:09

标签: language-agnostic monitoring

这对我来说是半实验性的。

我有一个超过100个(变量)节点的集群,我想编写一个监控应用程序,每隔n(例如1或2)秒轮询所有Web节点,并记录它们的响应时间。

如果网络节点已经在苦苦挣扎,我可能不想通过添加更多请求来降低它。如果轮询者有一些智慧,那就好了。

您会为这样的项目选择哪种语言?任何已经可以执行此操作的开源项目我可以查看吗?您能想到的任何技术挑战?

我开始关注Hyperic HQ代码,但是男人,那个东西很大。

2 个答案:

答案 0 :(得分:1)

看看OpenNMS,它在这种监控方面非常擅长,而且它是开源的,所以你可以在它的内部捅一下。

Hyperic HQ也非常好,但正如你所说,它是一个怪物。

答案 1 :(得分:1)

  

任何已经可以解决这个问题的开源项目?

如果我必须写这样的东西,我会使用RRDtool(可用于多种语言的实现)。

但在写任何内容之前,我会检查SmokePing或可以进行应用监控的众多(更详细的)监控解决方案之一: