我有一个运行PBS Pro的64节点集群。如果我提交了数百个工作,我可以一次运行64个。这很好,除非所有64个作业几乎都是I / O绑定,并且正在读/写同一个磁盘。在这种情况下,我希望能够仍然提交所有工作,但在给定时间最多(例如)10个工作。是否有允许我这样做的qsub咒语,而没有对集群的PBS服务器的管理访问权限?
答案 0 :(得分:3)
在TORQUE中,您可以通过在作业数组上设置插槽限制来完成此操作,只要您可以将作业排列为数组:
qsub script.sh -t 0-99%10
会限制其中10个一次投放。如果PBSPro具有与此相当的功能,那么您可以使用它。
答案 1 :(得分:0)
你可以让他们互相依赖。 或安排他们从不同的时间点开始。
否则,您的管理员可以减少您可以同时运行的同时作业数。