我有一个使用cnfcluster创建的AWS群集。它由4个m4.xlarge节点组成。我正在尝试编写一个sge脚本,每个核心使用一个任务。无论有什么变化,我只在输出中看到一个主机。 任何人都可以建议更改脚本吗?
ubuntu@ip-172-31-29-121:~$ qconf -sh
ip-172-31-16-28.us-west-2.compute.internal
ip-172-31-20-128.us-west-2.compute.internal
ip-172-31-29-121.us-west-2.compute.internal
ip-172-31-30-78.us-west-2.compute.internal
ip-172-31-30-81.us-west-2.compute.internal
SGE脚本
#!/bin/bash
#
#$ -cwd
#$ -j y
#$ -pe mpi 8
#$ -S /bin/bash
mpirun -np 8 hostname
输出
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
ip-172-31-30-78
答案 0 :(得分:0)
使用SGE选项安装OpenMPI(2.1.1)解决了使用多个节点的问题。
./configure --prefix=/usr/local --with-sge
群集配置的更改(请参阅AWS cfncluster)有助于为每个核心设置一个任务。