我目前正在监控一个拥有霍比特人的大型网络,其任务是减少错误(或至少不相关)的警报数量。在我的列表的顶部是由bbtest-net发起的测试“http”和“conn”。此命令检查ping,ssh等,如果ping超时,则立即将状态设置为红色。一分钟后,bbretest命令启动,检查所有新红色的主机,并再次发现它是绿色的。这种情况一直发生 ,这会使我的日志变得混乱。
有什么方法让我在第一次运行bbretest后让Hobbit报告红色状态?
答案 0 :(得分:2)
首先,这是一个编程网站,所以你不会得到很多答案。
但...... ......但是......
如果您的服务器超时,这不是问题吗?
听起来像Hobbit完成了它的设计工作:告诉你你有一些需要你注意的东西。
修复超时问题,你的日志应该没问题。
答案 1 :(得分:0)
我认为你最好的选择是避开Hobbit服务测试并编写自己的测试。这并不难。
除非多次连续尝试失败,否则您的测试脚本不会变为红色是个好主意。
你可以禁用标准的Hobbit,并使用你自己的。话虽如此,“conn”测试的默认行为似乎相当合理(如果服务器没有ping,则立即变为红色)。
不幸的是,Hobbit警报系统没有选项只能警告X分钟是否存在问题,这确实很有用 - 但我相信你也可以使用自定义警报脚本。
答案 2 :(得分:0)
您可以使用:
<ip> <hostname> # noconn
在bb-hosts中,服务器不响应ping。然后通过服务测试它的活力。