Icinga2检查多个主机

时间:2016-08-12 15:29:53

标签: cluster-computing monitoring icinga

我有一个HPC群集,我想用Icinga2来监控它的健康状况。我为群集中的每个节点定义了许多检查,但我真正想要的是在超过一定百分比的节点生病时收到通知。

我注意到可以定义一个代表集群的虚拟主机,并使用Icinga域特定语言来实现我感兴趣的事情(http://docs.icinga.org/icinga2/latest/doc/module/icinga2/chapter/advanced-topics?highlight-search=up_count#access-object-attributes-at-runtime)。然而,这似乎是一个不优雅和尴尬的解决方案。

是否可以定义这种"聚合"或者"元检查"在主机组?

1 个答案:

答案 0 :(得分:0)

没有任何解决方案,这样的东西放在文档中帮助了不少用户,即使它不那么优雅。外部插件(如业务流程)可以执行相同操作但需要其他配置。例如,Vagrant盒集成了Icinga Web 2模块。

其他用户倾向于使用check_multi或check_cluster。也不那么优雅。

虽然这个想法很好并且持续时间很长,但没有立即实施此类功能的计划。