在使用aws cfncluster创建的群集上使用默认的SGE调度程序。
我需要一个特定的节点(主节点,openmpi中的等级为0)以具有比其他计算节点更多的RAM。
我尝试过提交单独的作业,一个作业提交给较大的节点,其余的作业提交给较小的计算节点,
qsub -l hostname=xxx -pe mpi 1 qmaster.sh && qsub -pe mpi 10 qjob.sh
但是主节点的COMM_WORLD.size
只有1。
有什么方法可以将第一个作业提交到指定的主机名。还是可能在提交作业的主机上运行第一个作业?