我正在使用consul exporter将我的服务的健康状况和状态提取到普罗米修斯。我想在Consul中的服务和节点状态至关重要时发出警报,然后在路由这些警报时使用从Consul中提取的标签。
我从this discussion了解到,服务标签可能会作为单独的指标导出,但我不确定如何将一个系列加入另一个系列,以便我可以利用具有健康状态的标签。
例如,以下查询:
max(consul_health_service_status{status="critical"}) by (service_name, status,node) == 1
可以返回:
{node="app-server-02",service_name="app-server",status="critical"} 1
但我也喜欢这个系列中的'env':
consul_service_tags{node="app-server-02",service_name="app-server",env="prod"} 1
连接node和service_name以将以下内容作为单个系列传递给Alertmanager:
{node="app-server-02",service_name="app-server",status="critical",env="prod"} 1
然后我可以在我的路由中匹配'env'。
有没有办法做到这一点?它并不像我任何操作或功能那样让我能够像这样分组或加入。据我所知,标签已经需要是consul_health_service_status指标上的标签。
答案 0 :(得分:16)
您可以使用group_left
的参数列表来包含右操作数中的额外标签(为清晰起见,括号和缩进):
(
max(consul_health_service_status{status="critical"})
by (service_name,status,node) == 1
)
+ on(service_name,node) group_left(env)
(
0 * consul_service_tags
)
这里的重要部分是操作+ on(service_name,node) group_left(env)
:
+
被“滥用”作为连接运算符(很好,因为0 * consul_service_tags
始终具有值0)group_left(env)
是包含右侧额外标签env
的修饰符(consul_service_tags
)