我正在尝试使用mpi4py来调用mpi可执行文件的第二个实例。
我收到错误:
Open MPI does not support recursive calls of mpirun
但我的印象恰恰是Spawn应该能够处理的 - 即设置一个新的通信器,在其中可以启动另一个mpi命令。
测试代码:
parent.py:
#!/usr/bin/env python
from mpi4py import MPI
import numpy
import sys
rank = MPI.COMM_WORLD.Get_rank()
new_comm = MPI.COMM_WORLD.Split(color=rank, key=rank)
print(new_comm.Get_rank())
new_comm.Spawn(sys.executable,
args=['test.py'],
maxprocs=4)
调用test.py:
#!/usr/bin/env python
from mpi4py import MPI
import numpy
import os
import sys
comm = MPI.Comm.Get_parent()
rank = comm.Get_rank()
cwd=os.getcwd()
directory=os.path.join(cwd,str(rank))
os.chdir(directory)
os.system('{}'.format('mpirun -np 4 SOME_MPI_EXECUTABLE_HERE'))
print("Finished in "+directory)
os.chdir(cwd)
comm.Disconnect()
我正在使用:
mpirun --oversubscribe -np 1 parent.py
将openmpi 2.0.0与gcc和python / 3.4.2一起使用
任何人都有任何明智的想法,为什么会发生这种情况......
谢谢!
答案 0 :(得分:2)
以下代码似乎按照我想要的方式执行。
#!/usr/bin/env python
from mpi4py import MPI
import numpy
import sys
import os
rank = MPI.COMM_WORLD.Get_rank()
new_comm = MPI.COMM_WORLD.Split(color=rank, key=rank)
print(new_comm.Get_rank())
cwd=os.getcwd()
os.mkdir(str(rank))
directory=os.path.join(cwd,str(rank))
print(rank,directory)
os.chdir(directory)
new_comm.Spawn("SOME_MPI_EXECUTABLE_HERE",
args=[""],
maxprocs=4)
运行:
mpirun --oversubscribe -np 4 parent.py
似乎启动4个SOME_MPI_EXECUTABLE实例,每个实例在4个核心上运行。
(感谢Zulan)