标签: cluster-computing lsf
我向LSF集群提交了许多作业的数组。大多数人在DONE状态下跑步和完成,但有些人可能会退出。我需要一种方法只重新运行数组的任何EXITing成员作业。
感谢。
答案 0 :(得分:2)
我一直在玩同样的问题和命令:
brequeue -e <jobarrayid>
应该做你想做的事。您无需指定应重新运行哪些元素,-e开关应仅选择EXIT'd索引。