我在Condor上运行工作,并注意到由于某种原因我的工作的一部分将运行但从未完成。提交文件中是否有一个设置,如果它需要一段时间才能完成,则会终止并重新提交作业?这类似于问题Condor Timeout for idle jobs 除了我希望Condor不要简单地杀死这些工作,但也要重新提交。
谢谢!
答案 0 :(得分:0)
您可以在机器类添加文件(Condor user manual)中使用KILL转换表达式。类似的东西:
START = True
...
+MaxJobExecutionTime = xxx #seconds
KILL = $(ActivityTimer) > MaxJobExecutionTime
像这样,机器会杀死超过MaxExecutionTime的作业。然后Condor将重试这项工作。