我正在启动slurm中的heterogenous job group,其中我的slurms脚本类似于:
/var/log/nginx
我的批处理提交看起来像:
sbatch --mem-per-cpu = 4g --ntasks = 1:--mem-per-cpu = 2g --ntasks 1 mybash.sh
我希望在完成短流程后会释放其分配,但是当我运行sacct时,我看到两个包组都被列为正在运行,尽管包组0的第一步运行被列为COMPLETE。
有没有一种方法可以使完成分配后的短流程释放出来?
答案 0 :(得分:1)
您必须使用scancel $SLURM_JOB_ID+0
明确地执行此操作,以取消例如pack-group 0。
#!/bin/bash
{ srun --pack-group 0 short-process ; scancel $SLURM_JOB_ID+0 ; } &
srun --pack-group 1 long-process &
wait