Cray XE6每个节点的并行任务/并行任务

时间:2013-07-15 08:00:04

标签: parallel-processing job-scheduling cray

在作业提交脚本(Cray XE6)中,“并行任务数”(-n)和“每个节点的并行任务数”(-N)之间有什么区别?

2 个答案:

答案 0 :(得分:2)

我对此缺乏经验,但有些谷歌搜索给了:

It looks like a MPI parameter in an example:

# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2

From Cray Brochure:

每个Cray XE6刀片包含四个高计算节点 小尺寸的可扩展性 - 每个高达128个处理器内核 刀片或每个机柜3,072个处理器核心。 每个计算节点 有两个AMD Opteron™6300系列处理器(16核)耦合 拥有自己的记忆和Gemini通讯接口而且 旨在有效地运行 32 MPI任务。或者,它可以 被编程为在计算节点和MPI中运行OpenMP 在节点之间。

根据上面的信息,对于一个完整的机柜,n最多可以为3072,对于两个opter(6300系列),n可以为32。

答案 1 :(得分:2)

man aprun将解决您的所有问题。

-n表示您需要多少个可执行文件实例(对于MPI,这意味着您需要多少个MPI进程)。

-N表示您希望每个节点有多少个实例。

-d是深度,即每个实例有多少个线程。