如何重新运行退出LSF作业数组的部分?

时间:2012-06-15 05:50:51

标签: cluster-computing lsf

我向LSF集群提交了许多作业的数组。大多数人在DONE状态下跑步和完成,但有些人可能会退出。我需要一种方法只重新运行数组的任何EXITing成员作业。

感谢。

1 个答案:

答案 0 :(得分:2)

我一直在玩同样的问题和命令:

brequeue -e <jobarrayid>

应该做你想做的事。您无需指定应重新运行哪些元素,-e开关应仅选择EXIT'd索引。