如何在一个GPU上并行运行多个作业?一种可行的选择是运行一个生成子进程的脚本。但是,还有没有办法使用SLURM本身呢?我尝试过
#!/usr/bin/env bash
#SBATCH --nodes=1
#SBATCH --gres=gpu:1
#SBATCH --overcommit
srun python script1.py &
srun python script2.py &
wait
但这仍然可以按顺序运行它们。
编辑:我们仍然想排他性地分配资源,即一个SBATCH作业应为其自身分配整个GPU。问题是,是否有一种简便的方法可以在SBATCH中并行启动多个脚本,而无需设置多处理环境。