Ganglia看到节点而不是指标

时间:2015-10-27 13:15:47

标签: hadoop mapreduce monitoring ganglia

我有一个拥有7个节点,1个主节点和6个核心节点的hadoop集群。在每台机器上设置Ganglia,并且Web前端正确显示7个主机。

但它只显示主节点(包括gmetad和gmond)的指标。其他节点具有与主节点相同的gmond.conf文件,并且Web前端清楚地看到节点。我不明白神经节如何识别7个主机,但只显示gmetad框中的指标。

任何帮助将不胜感激。有没有快速的方法来查看这些节点是否甚至发送数据?或者这是一个网络问题?

更新#1:当我远程登录到不是主节点的gmond主机,并查看端口8649时,我看到了XML但没有数据。当我在主机上telnet到8649时,我看到了XML和数据。有什么建议去哪里?

2 个答案:

答案 0 :(得分:4)

将此设置为您要监视的每个节点的所有gmond.conf文件:

send_metadata_interval = 15 // or something.

现在所有节点及其指标都显示在master(gmetad)中。

如果您以单播模式运行,则需要此额外配置,即,如果您在host而非udp_send_channel中指定mcast_join。在多播模式中,gmond守护者可以随时查询对方,并且不需要主动发送监控数据。

答案 1 :(得分:0)

在gmond配置中,请确保提供以下内容: -

cluster {
  name = "my cluster" #is this the same name as given in gmetad conf?
  ## Cluster name
  owner = "unspecified"
  latlong = "unspecified"
  url = "unspecified"
}

udp_send_channel {
  #mcast_join = 239.2.11.71 ## Comment this
  host = 192.168.1.10 ## IP address/hostname of gmetad node
  port = 8649
  ttl = 1
}

/* comment out this block itself
udp_recv_channel {
...
}
*/

tcp_accept_channel {
  port = 8649
}

保存并退出。重启你的gmond守护进程。然后执行“netcat 8649”。您现在能够使用指标查看XML吗?