为多个服务器/服务实现监视器的最佳方法

时间:2016-07-07 15:04:58

标签: server monitoring system-monitoring

我正在寻找创建一个监视器,负责跟踪一堆不同的VM(几乎总是基于ubuntu)。我计划通过发送请求进行测试,以及测试某些服务是否在特定VM上运行(这可能需要某种ssh组件?)。此数据将通过REST API发送到cachethq实例。

我将监控的一些服务包括:Jira,Confluence,Jenkins(以及从属节点),以及其他一些Atlassian套件产品。

我在考虑用python编写一些可以做到这一点的东西。有没有人有更好的其他建议?

感谢

3 个答案:

答案 0 :(得分:0)

假设您设置的监控服务器可以执行您描述的所有监控。然后您的监控服务器脱机。你怎么知道的?

解决这个递归监控问题会花费你比你可能估计的更多的时间,这就是为什么建立一个自己的监控解决方案几乎没有意义。

我使用便宜的灵活的正常运行时间监视器(我偏向https://wdt.io),在您的虚拟机上设置cron作业,测试您的服务,然后在正常运行时间监视器上卷曲一个唯一的URL。如果服务中断,则不会发生卷曲,显示器会提醒您。

使用web gui的那些服务,您可以通过定期ping相应的URL直接使用正常运行时间监视器进行监控。

答案 1 :(得分:0)

根据我的经验,我认为有必要进行内部VM监控(监控应用程序,端口状态,主机存活,CPU,RAM ......)以及通过用户体验(selenium)和远程检查进行外部监控。 所有这些信息都可以通过脚本或远程执行来提取,但是当有应用程序为我们提供所有这些时,我们为什么会这样做呢? 您可以使用软件可用代理找到社区应用程序作为Pandora FMS(http://pandorafms.org/en/features/monitoring-software/),您可以自动提取所有系统信息,并使用简单命令获取Jira,Confuence ...状态。它还允许您向所有这些VM添加自定义脚本和远程检查... 看看

答案 2 :(得分:0)

Nagios是一种灵活且可扩展的基础架构监控工具。它允许您编写自己的脚本来检查您需要检查的内容。

https://www.nagios.org/

我相信有一个带有UI的付费版本,但你可以免费获得IIRC的基本版本。