我想设置一个Grafana仪表板。我正在从Node Exporter接收指标,并将查询发送到Prometheus。
在此仪表板上,我想监视主机是否关闭。目前,我正在使用以下查询:
up{instance="host:port", job="node-exporter"}
我假设如果Node Exporter不可用,则整个主机都将关闭,或者至少存在一个严重的问题值得我们研究。此查询根据给定作业是否工作返回1
或0
。我可以为此或表或Polystat设置单个值框。无论如何:主机的表示应从绿色变为红色。
但是在某些情况下,我得到的不是0
,而是No datapoints found.
。显然,这意味着不正确的事情,我们应该尽快做一些事情,但是在这种情况下,主机的视觉表示只是从仪表板中消失了。这是很难注意到且非常烦人的事情。
是否可以为这些情况设置某种默认值?因此,如果No datapoints found.
仅返回0
。
示例:
在理想情况下,我看到了这么多主机(如您所见,其中一台主机已关闭并且我得到了正确的0
而不是No data points
的信息):
但是对于某些主机,如果我遇到No datapoints found.
错误,我只会看到很多,这是不对的:
我希望看到丢失的节点变成红色而不是消失。
我该怎么办?
答案 0 :(得分:0)
您可以执行up{instance="host:port", job="node-exporter"} or on() vector(0)
,当LHS为空时,它将不带标签的位置放入0。
不过,我不确定这是否是解决服务发现问题的好方法,因为这是与计算机故障完全不同的问题。