建议的异构基础架构监控解决方案是什么?

时间:2018-05-23 08:23:38

标签: monitoring prometheus

我正在寻找以下用例的监控工具:

  • 收集有关虚拟机的基本指标(cpu使用情况,内存使用情况,i / o,可用空间)
  • 从SQL Server中提取指标(可能正在运行一些查询)
  • 从外部服务中提取有关处理的信息,即当前正在运行的处理数量和持续时间。我正在考虑编写python脚本,但不知道如何与监视工具结合使用
  • 能够绘制图表并管理警报,不仅能够发送邮件,还能发送消息给slack / ms团队。

我是普罗米修斯的事情,因为它有wmi_exporter,node_exporter,sql exporter,警报管理器,可以向多个目的地发送通知,但我不知道如何处理这个外部服务和python脚本。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

普罗米修斯绝对可以做你说你需要做的事情。其中一些可能不是微不足道的,但你绝对可以自己填补空白。

E.g。你可以通过启动一个node_exporter并让它被Prometheus刮掉来获得基本上开箱即用的机器指标,但我不认为它有例如所有正在运行的进程的信息后者可能要求您编写代理/导出器:在/metrics上公开指标的简单Web服务器;有Python client library来帮助解决这个问题。或者说过程(假设它们是你的代码)将指标推送到Pushgateway,如果它们是短暂的批处理作业。

哦,对于图表/仪表板,您可能需要Grafana,因为普罗米修斯在该领域的能力相当有限,而且Grafana与普罗米修斯完美融合。