一段时间后重新开始工作Condor

时间:2015-06-13 17:26:56

标签: condor

我在Condor上运行工作,并注意到由于某种原因我的工作的一部分将运行但从未完成。提交文件中是否有一个设置,如果它需要一段时间才能完成,则会终止并重新提交作业?这类似于问题Condor Timeout for idle jobs 除了我希望Condor不要简单地杀死这些工作,但也要重新提交。

谢谢!

1 个答案:

答案 0 :(得分:0)

您可以在机器类添加文件(Condor user manual)中使用KILL转换表达式。类似的东西:

START = True
...
+MaxJobExecutionTime = xxx #seconds
KILL            = $(ActivityTimer) > MaxJobExecutionTime

像这样,机器会杀死超过MaxExecutionTime的作业。然后Condor将重试这项工作。