如何加速nagios监控云端的主机

时间:2016-10-14 09:33:22

标签: amazon-ec2 ubuntu-14.04 nagios nrpe

当使用遍布网络的多个主机的nagios时,主机状态显示可识别的滞后并且花费很长时间来反映nagios服务器cgi。那么什么是最佳的nrpe / nagios配置以加速分布式的状态过程主机环境。 在我的情况下,我使用nagios核心4.1 nrpe 1.5 服务器/客户:亚马逊ec2

1 个答案:

答案 0 :(得分:0)

GUI通常每分钟(自动)更新一次,但点击刷新可以为您提供“差不多”的最新信息。我说几乎是因为Nagios核心内部存在一个独特的处理循环,导致它永远不是实时的。 NRPE将以您的网络连接速度运行 - 除了发送和接收少量数据之外,它几乎没有其他功能。关于这里唯一的延迟是实际执行检查并发回响应所需的时间 - 当然,这有很多因素可以提及。尝试查看

的输出
[nagioshome]/bin/nagiostats

有几个条目告诉你:

'Latency' - the time between when the check was scheduled to start, and the actual start time.

'Execution Time' - the amount of time checks are actually taking to run.

这些条目有三个数字,分别是;最低/最高/平均

高延迟数(在我的书中,这意味着平均值大于1秒)通常意味着您的Nagios服务器过度工作。您可以采取一些措施来缩短延迟时间,这些内容在“nagios.cfg”文件中列出。这种延迟与网络速度或NRPE的速度无关 - 主要是硬件速度。如果你已经在使用nagios.cfg中指定的最佳值,那么就该找到更快的硬件了。

高执行时间(对我而言,平均值大于5秒)可归咎于除Nagios系统之外的所有这可能是由网络故障引起的(不正确的数据包路由),过载的网络,错误和/或设计不良的检查,目标系统缓慢......列表是无穷无尽的。您使用Nagios和/或NRPE配置无需帮助降低这些值。那么,你可以禁用NRPE的加密来改善线路时间;但如果您首先启用了加密,那么您不太可能希望它被禁用。