在作业提交脚本(Cray XE6)中,“并行任务数”(-n)和“每个节点的并行任务数”(-N)之间有什么区别?
答案 0 :(得分:2)
我对此缺乏经验,但有些谷歌搜索给了:
It looks like a MPI parameter in an example:
# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2
每个Cray XE6刀片包含四个高计算节点 小尺寸的可扩展性 - 每个高达128个处理器内核 刀片或每个机柜3,072个处理器核心。 每个计算节点 有两个AMD Opteron™6300系列处理器(16核)耦合 拥有自己的记忆和Gemini通讯接口而且 旨在有效地运行 32 MPI任务。或者,它可以 被编程为在计算节点和MPI中运行OpenMP 在节点之间。
根据上面的信息,对于一个完整的机柜,n最多可以为3072,对于两个opter(6300系列),n可以为32。
答案 1 :(得分:2)
man aprun
将解决您的所有问题。
-n
表示您需要多少个可执行文件实例(对于MPI,这意味着您需要多少个MPI进程)。
-N
表示您希望每个节点有多少个实例。
-d
是深度,即每个实例有多少个线程。