如何查看Rocks Cluster上节点的详细工作?

时间:2016-01-22 18:22:14

标签: mpi cluster-computing nodes mpich rocks

我为我的学校项目构建了一个Rocks Cluster,它是矩阵乘法,有一个前端和另外5个作为节点的计算机。通过MPI,我发送它们用于乘法的矩阵部分,然后再发送数据。我运行的命令是:

mpirun -hostfile myhostfile ./myprogram

其中myhostfile是节点名称及其插槽(线程)编号的文件。 我的程序正在运行,我正在尝试分析它。

我的问题是我怎样才能看到每个节点核心/处理器正在处理他的任务的工作,所有处理器是否正常工作,是否存在某种过载? 我试图安装Vampir profiler和Intels Vtune Amplifier但是我有一些问题用上面的命令将它们附加到我的程序中(其他命令不允许我在节点的所有线程上运行我的程序)。我所完成的所有事情(看到我的节点在Ganglia之外运行良好)是从前端登录到一个节点并使用命令“top”我可以看到我的程序执行时线程数和几乎100%的CPU使用率在每个线程上。

1 个答案:

答案 0 :(得分:1)

看看mpstat

如果没有参数,它将显示所有核心的聚合负载

mpstat -P ALL显示每个核心的负载

这将为您提供节点的实时统计信息:

watch pdsh -w compute-01-[01-10] mpstat

(使用您的计算节点名称)