MPI程序仅在slurm脚本中执行一次

时间:2016-03-03 19:12:48

标签: c mpi hostname slurm

我已经尝试了MPI_Get_processor_name()gethostname()来打印我使用过的所有节点。但它只返回第一个节点的名称!谁能让我知道问题是什么以及如何获得所有节点的名称?

//testMPI.c
#include <mpi.h>
#include <stdio.h>

int main(int argc, char** argv) {

    MPI_Init(NULL, NULL);
    int world_size;
    MPI_Comm_size(MPI_COMM_WORLD, &world_size);
    int world_rank;
    MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
    char processor_name[MPI_MAX_PROCESSOR_NAME];
    int name_len;
    MPI_Get_processor_name(processor_name, &name_len);

    printf("Hello world from processor %s, rank %d"
           " out of %d processors\n", processor_name, world_rank, world_size);}


    MPI_Finalize();
}

我已经使用了一个工作脚本来运行它:

#!/bin/bash
#SBATCH --job-name=MPI-host
#SBATCH --account=123
#SBATCH --time=00:02:00
#SBATCH --mem-per-cpu=3900M
#SBATCH --ntasks-per-node=16
#SBATCH --nodes=4
#SBATCH --output=./output-mpi-host-test2.out

module load intel/2015.3
module load openmpi.intel/1.8.6

cp $(pwd)/$1 $SCRATCH
cd $SCRATCH

./$1

1 个答案:

答案 0 :(得分:2)

对于SLURM mpiexec,需要使用srun或批处理系统特定命令启动MPI程序。用

替换脚本中的最后一行
srun ./$1

注意:它会从作业脚本中自动获取参数。对于普通mpiexec,您应该提供进程数和其他参数。