我开始使用collectd(5.5.1),statsd(git head),涌入(1.2)和grafana来监控我的基础架构。收集部分适用于黑盒监控。我们想使用statsd进行白盒监控。
我们拥有的设置在每台主机上收集和统计,并将数据发送到监控主机上的Influxdb。 Influxdb和grafana在监控主机上运行。当然,collectd和statsd也会在监控主机上运行,就像在其他地方一样。
我在每台主机上的statsd配置只是
{
graphitePort: 2003,
graphiteHost: "monitor.example.com",
port: 8125,
backends: [ "./backends/graphite" ]
}
这在任何情况下都可能不理想,因为我刚刚发现有influxdb backend可用,但我希望即使我能做得更好,上述工作仍然有效。
但我有以下问题:
statsd为监视器主机not forwarding host information。
我已经了解到statsd的一个好处是它可以在以指定的刷新间隔发送数据之前聚合本地主机上的数据。但是我没有在文档中看到指定哪些指标得到总结,发送最大值,发送百分位数等等。
这些组件在过去一年中发展得如此之快,以至于相当多的文档和教程已经过时,所以我很清楚,如果阅读了错误的文档,我可能已经做了一些不正确的事情。 / p>
我最近还发现了电报(在每个主机上运行?)。也许我对statsd有错误的期望(或者应该使用电报)?
我很乐意根据反馈更具体地提出这个问题。我知道我仍在努力解决一些问题。
非常感谢指针。
答案 0 :(得分:0)
这是一个没有准确答案的解决方案。
我发现telegraf现在已经成为这个领域非常可行的竞争者,得到了很好的支持,看到了积极的发展,并且很容易与人们谈判。 Telegraf还支持每条消息的附加标签和标志,而statsd似乎是简单的键值。此外,telegraf不再需要statsd和collectd,因此它将移动部件的数量减少一个。这是一件好事。
(TL; DR - 也许我是跛脚)
我无法通过statsd找出如何转发主机信息。
我没有找到关于如何配置聚合的好文档(尽管我记得曾经找到过一次)。使用Influxdb协议发送数据的模块似乎没有得到很好的维护(相对于Influxdb开发)。
在这两点上我可能完全错了,为了记录这些事情,我们非常欢迎其他答案。