问题:
我在 Grafana 中有一个仪表板,用于监控我的监控服务的运行状况: Prometheis,Alertmanagers,Pushgateways和Grafana 本身。它在 Singlestat面板中显示这些服务的简单上/下状态。
当我的一个Premetheus(每个数据中心都有一个)关闭时,以此Prometheus作为数据源支持的Singlestat面板正在加载30s,直到显示“请求错误” 。
更糟糕的是,当我只希望每个Prometheus实例只有一个面板,并合并所有监视它们的Prometheis的结果时(我设置中的Prometheis相互监视)。为此,我使用 -mixed- 数据源,在这种情况下,当其中一个使用的数据源出现故障时 Singlestat面板永远加载,当在Prometheis的所有Singlestat面板中添加了向下数据源时,所有这些面板将永久加载。
另外,当Prometheis之一停止工作时,某些Grafana页面的加载时间非常长: 配置->数据源 和 仪表板->主页。 但这并不总是如此,有时它可以正常加载。
调查:
我调查了Grafana数据源中的查询超时(将其设置为1s),但是对此问题没有任何影响。
我还尝试添加数据源变量。它只能部分解决问题,我对此不满意:
我为每个带有此变量dastasource支持的Prometheus在Dashboard和Singlestat面板中都有一个带有数据源的组合框。问题是我必须在一个组合框中更改所有Prometheis才能查看Prometheus服务的整体情况。
类似地,可以为数据源和Prometheus实例的所有组合创建Singlestat面板(在我的情况下为3 x 3面板),但是这并不直观,并且将来我将添加的每台Prometheus服务器都变得越来越差。 / p>
问题:
有什么方法可以处理无法访问的数据源,仪表板将继续工作?
也许我必须在设置中添加一些组件,但是我认为应该在Grafana中完成(尽管似乎不可能)。