Grafana 托管警报 - 如何在警报注释和标签中使用 Loki 标签值?

时间:2021-07-26 09:35:48

标签: prometheus grafana grafana-loki opsgenie

我目前正在使用 Loki 作为我的数据源在 Grafana v8.0.3 上构建一些 Grafana 托管警报。

我有以下查询 (A):

count_over_time({type="ErrorLogs",fullPipelineName="Test"} [20s])

我有一个表达式 (B),当 A 的总和大于 0 10 秒时触发警报。

警报似乎按预期触发,这基本上是因为任何带有上述标签的日志进入 Loki。但是,这些日志还附加了各种其他标签,我想在警报标签和注释中使用它们,例如,它们具有 reasonresolution 标签。但我无法弄清楚如何访问这些值,或者是否有可能。我已经尝试了 {{ $labels.reason }}{{ reason }}{{ $reason }} 等的所有排列,但似乎没有任何效果。

如果我完全错误地解决这个问题并且有人可以提供更好的查询或这样做的方法,最终我想做的是:

每当有与某些标签匹配的日志进入 Loki 时,创建警报并将其发送到 OpsGenie。应该在日志进入后立即(或尽快)创建警报,并且应该为每个匹配的日志创建警报(这是我上面查询的一个潜在问题,好像两个匹配的日志在 20 秒的窗口内通过,警报只会触发一次,尽管在这种情况下这是意外行为)。我想将日志中的其他标签值(查询中未使用的标签)与警报传递给 OpsGenie。

任何帮助将不胜感激。

0 个答案:

没有答案