Sun Grid Engine作业依赖性行为

时间:2018-07-18 21:12:04

标签: dependencies sungridengine

我正在使用Sun Grid Engine作业/任务依赖机制(-N选项和-hold_jid选项)向集群提交(qsub)许多依赖作业。如果作业a使用非零返回/退出代码退出,并且作业b和所有依赖于b的作业都从队列中删除,我希望不启动依赖作业a的作业b。

但是,我观察到的行为是,如果作业a以除100外的任何代码退出(如手册页中所述),作业b将在完成作业后从hqw切换到qw,最后是r。如果我用代码100退出作业,Sun Grid Engine似乎可以解决此问题,而作业a则显示为Eqw,作业b永远停留在hqw中。

我正在使用sub -b y,我的命令是一个简单的Python脚本,带有sys.exit(100)来模仿退出代码的行为。 是否有任何直接的方法,还是我需要使用qstat和qacct -j轮询网格引擎,并手动轮询不应该运行的qdel作业,因为先前的作业未成功完成,即未返回退出代码0?

谢谢

0 个答案:

没有答案