SGE / UGE暂停正在运行的作业

时间:2013-12-19 08:47:34

标签: grid jobs suspend

我知道,可以通过qmod -sj [jobid]命令暂停正在运行的作业,并且原则上可以正常工作。这意味着工作岗位暂停状态 - 到目前为止很好,但是:

我预计,如果我将所有正在运行的作业暂停到状态并将qsub新的作业挂起到GE或等待作业,那么这些就会运行,但事实并非如此。

对此主题的一些搜索引导我http://gridengine.org/pipermail/users/2011-February/000050.html,这实际上指向了方向,暂停的工作使GE免费运行其他工作。

1 个答案:

答案 0 :(得分:0)

请参阅here。:

  

在工作负载管理器中使用"内置"抢占,像Platform LSF,   它的工作原理是暂时放宽节点上的插槽数限制   然后通过碰撞最低工作来解决超额认购问题   图腾柱可以在插槽数限制下恢复作业数量。   在Sun Grid Engine中,同样的事情发生了,除了代替   调度程序暂时放宽了插槽计数限制,你就像   管理员配置主机的插槽多于您需要的插槽和a   在工作计数上创建人为下限的一组规则   通过碰撞最低优先级的工作来强制执行。

主题略有不同,但主体似乎可以保持相同:在保持暂停的情况下运行其他作业,暂时增加相关节点上的插槽数。