我已经尝试了MPI_Get_processor_name()
和gethostname()
来打印我使用过的所有节点。但它只返回第一个节点的名称!谁能让我知道问题是什么以及如何获得所有节点的名称?
//testMPI.c
#include <mpi.h>
#include <stdio.h>
int main(int argc, char** argv) {
MPI_Init(NULL, NULL);
int world_size;
MPI_Comm_size(MPI_COMM_WORLD, &world_size);
int world_rank;
MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
char processor_name[MPI_MAX_PROCESSOR_NAME];
int name_len;
MPI_Get_processor_name(processor_name, &name_len);
printf("Hello world from processor %s, rank %d"
" out of %d processors\n", processor_name, world_rank, world_size);}
MPI_Finalize();
}
我已经使用了一个工作脚本来运行它:
#!/bin/bash
#SBATCH --job-name=MPI-host
#SBATCH --account=123
#SBATCH --time=00:02:00
#SBATCH --mem-per-cpu=3900M
#SBATCH --ntasks-per-node=16
#SBATCH --nodes=4
#SBATCH --output=./output-mpi-host-test2.out
module load intel/2015.3
module load openmpi.intel/1.8.6
cp $(pwd)/$1 $SCRATCH
cd $SCRATCH
./$1
答案 0 :(得分:2)
对于SLURM mpiexec
,需要使用srun
或批处理系统特定命令启动MPI程序。用
srun ./$1
注意:它会从作业脚本中自动获取参数。对于普通mpiexec
,您应该提供进程数和其他参数。