当我们通过sbatch
提交工作时,pid到增量订单给出的工作。根据我的观察,这个顺序从1开始。
sbatch -N1 run.sh
Submitted batch job 20
//目标是在可能的情况下更改提交的批处理作业的ID。
[Q1] 例如,在slurm下有一个正在运行的作业。当我们重新启动节点时,作业是否继续运行?它的pid是否会更新或保持原样?
[Q2] 是否可以使用群集所有者想要提供的唯一ID来提交或更改已提交作业的pid?
感谢您宝贵的时间和帮助。
答案 0 :(得分:2)
如果节点失败,则作业将被重新排队 - 如果JobRequeue
中的slurm.conf
参数允许这样做。它将获得与先前启动的运行相同的作业ID,因为这是数据库中用于管理作业的唯一标识符。 (用户可以使用--no-requeue
sbatch参数覆盖重新排队。)
无法更改作业ID,没有。