是否可以配置nagios为每个主机组或服务组发送通知?

时间:2012-01-07 12:16:31

标签: monitoring nagios

我在nagios中创建了几个主机组,每个主机组由几个主机组成。主机承载由服务检查监控的应用程序,每个应用程序始终至少7个或更多。 因此我的问题是:当我们说主机组中的主机A上的应用程序“测试”正在下降时,我突然收到大约7个通知,描述主机组“测试”中主机A上的7个应用程序控制中的每一个都处于严重状态。

我希望nagios配置的是发送一个通知,例如,服务检查,消息计数在主机A上处于严重状态,然后最多再发送一个主机组“测试”已关闭的通知。这样我就不会收到7次通知,而且我知道我必须修复特定主机组中特定主机的问题。这样就可以更清楚地解决什么问题了。

添加另一个示例:当主机A上的应用程序出现故障并且我收到10个通知时,几秒钟之后http_checks将开始通知我,因为apache不会从应用程序中接收数据。所以我最终解决了一个问题并收到大约20个或更多通知。我最不感兴趣的是最多4个通知。主机A上的一对一服务检查和主机A所在的每个主机组一个,然后每个主机组都是相同的,其中是apache。或者,如果它们位于同一主机组中,则根本只会有2个通知。

如果同时在另一个主机组中出现类似问题,我会再次知道有两个主机组有问题需要修复。然而,目前的情况是我收到大约50个通知并且混淆了从哪里开始以及真正的问题是什么。

你们中间有人面临类似的问题吗?我正在寻找相当长的时间来解决这个问题。我尝试使用依赖项,但没有找到方法来配置nagios到我上面描述的情况。父子关系只能用于每个主机。升级根本无法解决这个问题。

也许我只是错过了有关此配置的文档中的一些信息。非常感谢任何建议。

1 个答案:

答案 0 :(得分:1)

Nagios可以通过服务依赖性检查来完成此操作。请参阅:http://nagios.sourceforge.net/docs/nagioscore/3/en/dependencies.html

但设置并保持管理真的很痛苦。我发现最简单的解决方案是使用NRPE命令(在目标主机上定义)可以执行几乎无限数量的实际检查。全部通过单一的Nagios服务检查。我'捆绑'单个应用程序的所有检查(处理上/下,各种日志碎片,日志年龄等),以便每个单独的应用程序只有一个检查。检查结果会告诉您哪个检查失败了。