我们在EC2中有大约20个服务器,大多数是动态生成的(缩放组)。
我们正在寻找一种监控应用程序正常运行时间的解决方案。
作为一个额外的好处,这个解决方案还可以扩展到实际监控所涉及的服务器,因此它很容易回到过去,看看在停机或等等之前发生了什么。
我们正在寻找理想的托管解决方案,它应该很容易随之扩展(它需要以某种方式动态处理添加/删除的服务器而不与我们交互)。
无论如何,希望你们提出一些建议。
有点背景......
我们目前正在使用自定义Nagios设置,现在它已经简化为基本上进行简单的http检查,因为服务器已经变得完全动态。我们已经使用PagerDuty来传递页面。它确实没问题,但是为了维护成本,我们可以使用http检查@服务器密度Pingdom。
我简要介绍了ServerDensity,它确实看起来很有前途,我特别喜欢他们的安装机制,只是将他们的文件转储到你的AMI中,它负责其余的工作。
我想知道在深入研究任何特定解决方案之前有什么选择。
答案 0 :(得分:1)
我们结合使用Server Density进行监控,并使用PagerDuty进行警报。这两个人很好地合作。