我目前正在使用ClusterVisionOS 3.1开发集群。这将是我第一次使用群集,所以我可能没有尝试过“明显的”。
我可以使用“qsub”命令向集群提交单个作业(这我已正常工作)
但问题是在一次提交多个职位时开始。我可以写一个脚本一次发送所有节点,但是所有节点都会占用我的工作,这里有更多的人想要提交他们的工作。
所以这是交易:
32个节点(每个4个处理器/插槽)
最好的事情是告诉群集使用3个节点(12个处理器)并将这些节点/处理器上的所有作业排队,如果可能的话。如果我可以让节点为每个作业使用1个处理器,那么这将是完美的。
答案 0 :(得分:0)
好的,所以我想我发现了,这个问题没有解决办法。我的个人解决方案是编写一个脚本,通过ssh连接到集群,然后让脚本检查已经在您的用户名下运行的作业数。该脚本会检查该数字是否同时不超过20个作业。只要没有达到这个数字,它就会继续提交工作。
也许这是一个丑陋的解决方案,但却是一个有效的解决方案!
关于处理器的事情,这些作业已经提交给不同的单处理器,充分利用了节点的全部范围。