定期进行大规模服务监控

时间:2013-12-08 02:39:38

标签: php curl

我需要在大量服务器上获取服务状态,以便计算正常运行时间百分比。我可能需要使用多个服务器来进行检查。有没有人知道一种可靠的方法来排队它们以特定的时间/间隔进行检查?

我正在用PHP编写应用程序,但我愿意为此使用其他语言和工具。我唯一的要求是它必须在Linux上运行。

我已经调查过像Gearman那样排队的事情,但是我找不到任何可行的方法。

1 个答案:

答案 0 :(得分:2)

为了获得服务的正常运行时间百分比,您可以执行命令来检查服务的状态并将其记录下来以进行进一步的分析/计算。以下是一些相同的方法:

  1. 系统命令,例如topfree -mvmstatiostatiotopsarnetstat等。在分析/调试问题时,这些linux实用程序附近。这些命令可以让您清楚地了解服务器内部的内容。
  2. SeaLion:代理也执行#1和自定义命令中提到的所有命令。可以在漂亮的Web界面中访问这些命令的输出。当您在数百台服务器上工作时,此工具非常方便,因为安装非常简单。它的免费
  3. Nagios:它是所有监控/警报工具的母亲。它非常可定制,但很难为初学者设置。虽然有一些nagios插件。
  4. 穆宁
  5. 服务器密度:基于云的付费服务,可收集重要的Linux指标,并为用户提供编写自己的插件的能力。
  6. New Relic:另一个众所周知的托管监控服务。
  7. 的zabbix