我想衡量Hadoop集群对CPU,内存等的利用率。我没有监控系统,例如Ganglia,Cloudera Manager等,因此必须使用更多的动手方法。我也没有安装YARN,所以也没有Resource Manager gui。这是Red Hat linux上的Hadoop CDH4版本。
我将如何手工获得这些数字?例如,为了收集CPU使用率,我是否将ssh放入每个datanode并运行'vmstat:
$ vmstat -S m
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
5 5 0 1496 4179 214609 0 0 1064 1724 0 0 10 2 76 12 0
然后取所有节点上每个数字的总和,然后除以节点总数,得出平均值?还是在Hadoop中有其他本机方式可以在不使用监视系统的情况下报告此信息(请确保监视系统在幕后运行各种OS命令。)。