我有一堆作为slurm中的数组作业运行的作业:
123_[1-500] PD my_job 0:00 me
123_2 R my_job 9:99 me
123_3 R my_job 9:99 me
123_4 R my_job 9:99 me
123_5 R my_job 9:99 me
...
当我阅读scancel上的手册页时,似乎表明如果我执行scancel 123
,它将停止所有内容
我错了,还是有另一种方法可以阻止阵列工作?我希望已经完成的工作完成,我只是不想要123
创建更多的工作,而我真的不想知道哪些工作需要重新运行如果我在中途意外杀死他们
答案 0 :(得分:1)
您可以使用其他scancel
代码发出--state
:
scancel --state=PENDING 123
或简而言之:
scancel -t PD 123
这将只取消待处理的123阵列的作业,并将使已经启动的作业保持运行。
答案 1 :(得分:0)
我暂停工作:has_many through
完成scontrol hold 123
报告的所有工作后,我就可以取消它。