Grafana:监视主机状态

时间:2019-12-20 06:01:51

标签: prometheus grafana

我想设置一个Grafana仪表板。我正在从Node Exporter接收指标,并将查询发送到Prometheus。

在此仪表板上,我想监视主机是否关闭。目前,我正在使用以下查询:

up{instance="host:port", job="node-exporter"}

我假设如果Node Exporter不可用,则整个主机都将关闭,或者至少存在一个严重的问题值得我们研究。此查询根据给定作业是否工作返回10。我可以为此或表或Polystat设置单个值框。无论如何:主机的表示应从绿色变为红色。

但是在某些情况下,我得到的不是0,而是No datapoints found.。显然,这意味着不正确的事情,我们应该尽快做一些事情,但是在这种情况下,主机的视觉表示只是从仪表板中消失了。这是很难注意到且非常烦人的事情。

是否可以为这些情况设置某种默认值?因此,如果No datapoints found.仅返回0

示例:

在理想情况下,我看到了这么多主机(如您所见,其中一台主机已关闭并且我得到了正确的0而不是No data points的信息):

enter image description here

但是对于某些主机,如果我遇到No datapoints found.错误,我只会看到很多,这是不对的:

enter image description here

我希望看到丢失的节点变成红色而不是消失。

我该怎么办?

1 个答案:

答案 0 :(得分:0)

您可以执行up{instance="host:port", job="node-exporter"} or on() vector(0),当LHS为空时,它将不带标签的位置放入0。

不过,我不确定这是否是解决服务发现问题的好方法,因为这是与计算机故障完全不同的问题。