我可以在slurm中取消数组作业吗?

时间:2017-11-15 22:16:13

标签: slurm

我有一堆作为slurm中的数组作业运行的作业:

123_[1-500] PD my_job 0:00 me
123_2       R  my_job 9:99 me
123_3       R  my_job 9:99 me
123_4       R  my_job 9:99 me
123_5       R  my_job 9:99 me
...

当我阅读scancel上的手册页时,似乎表明如果我执行scancel 123,它将停止所有内容

我错了,还是有另一种方法可以阻止阵列工作?我希望已经完成的工作完成,我只是不想要123创建更多的工作,而我真的不想知道哪些工作需要重新运行如果我在中途意外杀死他们

2 个答案:

答案 0 :(得分:1)

您可以使用其他scancel代码发出--state

 scancel --state=PENDING 123

或简而言之:

 scancel -t PD 123

这将只取消待处理的123阵列的作业,并将使已经启动的作业保持运行。

答案 1 :(得分:0)

我暂停工作:has_many through完成scontrol hold 123报告的所有工作后,我就可以取消它。