我有一个拥有7个节点,1个主节点和6个核心节点的hadoop集群。在每台机器上设置Ganglia,并且Web前端正确显示7个主机。
但它只显示主节点(包括gmetad和gmond)的指标。其他节点具有与主节点相同的gmond.conf文件,并且Web前端清楚地看到节点。我不明白神经节如何识别7个主机,但只显示gmetad框中的指标。
任何帮助将不胜感激。有没有快速的方法来查看这些节点是否甚至发送数据?或者这是一个网络问题?
更新#1:当我远程登录到不是主节点的gmond主机,并查看端口8649时,我看到了XML但没有数据。当我在主机上telnet到8649时,我看到了XML和数据。有什么建议去哪里?
答案 0 :(得分:4)
将此设置为您要监视的每个节点的所有gmond.conf文件:
send_metadata_interval = 15 // or something.
现在所有节点及其指标都显示在master(gmetad)中。
如果您以单播模式运行,则需要此额外配置,即,如果您在host
而非udp_send_channel
中指定mcast_join
。在多播模式中,gmond
守护者可以随时查询对方,并且不需要主动发送监控数据。
答案 1 :(得分:0)
在gmond配置中,请确保提供以下内容: -
cluster {
name = "my cluster" #is this the same name as given in gmetad conf?
## Cluster name
owner = "unspecified"
latlong = "unspecified"
url = "unspecified"
}
udp_send_channel {
#mcast_join = 239.2.11.71 ## Comment this
host = 192.168.1.10 ## IP address/hostname of gmetad node
port = 8649
ttl = 1
}
/* comment out this block itself
udp_recv_channel {
...
}
*/
tcp_accept_channel {
port = 8649
}
保存并退出。重启你的gmond守护进程。然后执行“netcat 8649
”。您现在能够使用指标查看XML吗?