所以这是我的意图: 我在每台服务器上都有一个Node导出器,它为我提供了Up指标,这仅仅是因为导出器关闭了,并不意味着该服务器已关闭。因此,请另外使用Blackbox导出程序到并检查服务器是否可以通过icmp进行访问。现在,我想将这两个指标合并为一个警报,因为如果无法通过Ping访问服务器并且导出器已关闭,则服务器实际上已关闭的可能性很高。
这是我的查询:
Instance:Up == 0 and ON(instance) instance:probe_success == 0
问题在于实例标签略有不同: 节点导出器在端口10500上运行,该端口指向标签my.instance.com:10500,而icmp不使用该端口,因此my.instance.com。
有没有办法将它们结合起来?
答案 0 :(得分:0)
您可以使用label_replace
用instance
中的"hostname:port"
值仅用主机名替换instance
标签(或添加其他标签)。
类似的东西:
up{job="node"}
or on(instance)
label_replace(probe_success{job="prober"}, "instance", "$1", "instance", "(.+):.+"