监控应用程序,正常运行时间,日志文件等

时间:2009-06-18 23:45:44

标签: monitor

如何监控生产中的应用程序?日志,正常运行时间等...(我更喜欢外部应用程序,免费和开源)

例如,我想

  1. 如果应用程序出现故障,则发送警报的能力
  2. 如果cpu使用情况发送警报>超过设定的门槛
  3. 如果内存使用情况发送警报>超过设定的门槛
  4. 发送错误消息提醒
  5. 必须是可配置的,如果在Y时间段内发生X次,则可能会发送一些错误

5 个答案:

答案 0 :(得分:3)

什么样的申请?

过去我曾使用过Nagios。它是免费和开源的。它允许您设置警报,监视事件日志,监视特定于应用程序的日志,以及监视服务器基础结构和网络本身。

http://www.nagios.org/

答案 1 :(得分:1)

许多人正在转向面向数据的解决方案。虽然大多数监控工具(nagios等)提供静态图表,但它们更加孤立,传统视图 - 今天的应用程序高度分布,交易跨越多个服务器,事情可能变得疯狂。对于超越kpis和简单api的更多优势功能,您需要查看机器数据解决方案,如LogscapeSplunk。它们允许您创建灵活的仪表板等,并可以交互式钻取以提供非常丰富的根本原因分析。查看此页面上的一些应用LogscapeApps

答案 2 :(得分:0)

Nagios是一种可行的方式 - 一种学习曲线,但可定制且功能强大。还有一个服务器端守护进程,可以监视文件,磁盘空间等。

答案 3 :(得分:0)

我们有一个内部定制的监控软件。

它监视我们各种实时机器上的事件日志(并测试)我们的Web应用程序产生的错误。我们所有的Web应用程序都会写错误日志的任何异常它还会ping服务器并监控驱动器空间。

每个开发计算机上都有一个客户端应用程序,用于轮询监视我们已定义的所有服务器的服务器应用程序。此客户端应用程序在任务托盘中运行,并在任何超出常规的情况下弹出消息,以便开发人员立即看到它。我们还可以看到测试人员何时遇到错误,并且在测试人员报告错误时通常会有一个修复程序或至少有一个修复程序正在进行中。

服务器还会通过电子邮件发送到通讯组,这样我们就可以在不工作时看到重要错误。

它还能够抑制预定义的异常/错误。

答案 4 :(得分:-2)

Google Analytics ???