服务器和服务状态监视器。发展思路?

时间:2019-10-24 07:02:01

标签: server monitoring monitor

早上好,我目前正在6个服务器的集群中工作。它们每个都处理特定任务(HTTP,MySQL,MySQL镜像,Redis和AMQP等其他服务)。

其中一台服务器或其中一项服务的故障导致系统停止工作;所有服务器都是至关重要的。这个想法可以重用所有服务器,但是在此之前,我想对每个服务器和服务中发生的事情有一个了解。

我想为服务器和服务构建自定义状态监视器。通过网络访问。这个想法如下:

  • 通过SSH访问服务器。
  • 运行使用Python编写的脚本,并使用psutil库获取CPU,RAM,硬盘驱动器和网络的状态。
  • 执行一系列用Python编写的脚本,并通过使用命令库在服务器上直接执行命令来获取服务的状态。

这将在每台服务器上完成,间隔为3秒。

事实是,我不知道是否有更好的方法来安装它,但这是我的第一个想法,我需要其他意见。

您知道执行此任务的其他最佳方法吗?

谢谢!

0 个答案:

没有答案