如何使用SLURM限制在同一节点上运行的作业数量?

时间:2017-11-19 04:46:40

标签: slurm

我有100个工作岗位。我想最多可以将作业数组中的2个作业分配到同一个节点。我怎么能用SLURM做到这一点?谢谢!

1 个答案:

答案 0 :(得分:2)

假设作业可以共享节点,并且该节点具有同类配置,并且您在群集中独自一人,

  1. 使用sinfo -Nl命令查找每个节点的CPU数量
  2. 根据您的工作提交的#SBATCH --tasks-per-node=...#SBATCH --cpus-per-task=...提交请求占该号码一半的工作
  3. 如果您管理的是其他人共享的群集,您可以定义虚拟类型的GRES,并将其中两个分配给slurm.conf中的每个节点,然后为每个作业请求一个--gres=dummy:1