我们有一个石墨全栈服务器,它接收来自不同机器的指标。当其他collectd客户端正在发送数据时,其中一个客户端发出以下错误:
Jan 29 23:24:44 collectd-client collectd [25489]:write_graphite plugin:send 到graphite-server:2003((null))失败,状态为-1(连接 被拒绝)1月29日23:24:44 collectd-client collectd [25489]:收集:停止 5写线程。
collectd.conf as below
LoadPlugin syslog
LoadPlugin cpu
LoadPlugin df
LoadPlugin disk
LoadPlugin interface
LoadPlugin load
LoadPlugin memory
LoadPlugin rrdtool
LoadPlugin write_graphite
<Plugin df>
MountPoint "/"
</Plugin>
<Plugin disk>
Disk "/^[hs]d[a-f][0-9]?$/"
</Plugin>
<Plugin interface>
Interface "eth0"
</Plugin>
<Plugin write_graphite>
<Node "carbon">
Host "sde-graphite"
Port "2003"
Prefix "collectd"
Postfix "collectd"
StoreRates true
AlwaysAppendDS false
EscapeCharacter "_"
</Node>
</Plugin>
答案 0 :(得分:1)
验证在端口2003处是否在主机sde-graphite中运行碳。您可以执行netstat并查看2003年是否有 UDP侦听器。我猜,它没有运行。
答案 1 :(得分:1)
求助:
我遇到了同样的问题,我的指标始终有效但随机某些节点停止发送指标。并且collectd显示相同的错误:
Jun 18 15:04:23 node-a collectd [20235]:write_graphite插件:发送到10.8.0.100:2003(udp)失败,状态为-1(无效参数)
Jun 18 15:04:23 node-a collectd [20235]:过滤子系统:内置目标`write&#39 ;:调度所有写插件的值失败,状态为-1。
守护程序仍处于活动状态,但未向石墨发送指标。 注意:我的节点通过openvpn隧道将数据发送到石墨。
这似乎是针对石墨服务器的连接超时错误。我可以通过停止/中断vpn服务来重现错误,并立即收集显示上面的错误。
希望它有所帮助 享受!