我有一些带有图表的grafana仪表板,有时会显示“无数据点”。我知道有数据,因为有时我在同一页面上看到图形和其他图形显示来自相同测量的其他结果。另外,我可以直接在Influxdb中查询数据。
有趣的是,似乎更长的时间段更可能导致这种失败而不是更短的时间(即30天有时失败,1天很少失败)。这是每隔几秒钟的数据,如系统统计数据。
我怀疑(数据不足)潮流有时需要太长时间才能响应并且grafana超时,否则由于相对于可用资源的数据太多,涌入的内核完全无法通过查询。 OTOH,直接查询Influxdb工作得很好(见下文),虽然我一次只抛出一个查询。如果我在仪表板更新时进行查询,则查询需要更长时间,就好像我正在等待工作线程处理我的查询。
但在我开始发展硬件之前,我想要的不仅仅是预感。我没有那个很多数据。然而,涌入和grafana日志并没有向我显示任何非常有趣的内容(例如OOM,超时或查询失败)。
有什么建议吗?
BTW,grafana中的示例查询是这样的:
SELECT percentile("usage_system", 95) FROM "cpu"
WHERE "host" =~ /^$host$/ AND $timeFilter
GROUP BY time($__interval), "host"
如果我直接查询Influxdb,则会立即返回查询结果,而在grafana中,我会使用微调器显示等待很长时间。 (如果我在更新仪表板的同时查询,则查询需要一点,与等待工作线程处理我的查询一致。)
select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= 1519216559000000000 AND time <= 1521808559000000000
GROUP BY time(1h), host
或
select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= '2018-02-23T00:00:00Z' AND time <= '2018-03-23T00:30:00Z'
GROUP BY time(1h), host