因此,我设置了一个执行外部程序的短脚本(用Fortran 77编写)。我想运行该程序的多个实例,因为我的计算机上有8个核心,我找到的最简单的解决方案是:
import subprocess
import os
i = n
while(i<n):
dire = "dir/Run"+str(i)+"/"
os.chdir(dire)
p1 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+1)+"/"
os.chdir(dire)
p2 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+2)+"/"
os.chdir(dire)
p3 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+3)+"/"
os.chdir(dire)
p4 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+4)+"/"
os.chdir(dire)
p5 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+5)+"/"
os.chdir(dire)
p6 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+6)+"/"
os.chdir(dire)
p7 = subprocess.Popen(['./mej'])
dire = "dir/Run"+str(i+7)+"/"
os.chdir(dire)
p8 = subprocess.Popen(['./mej'])
dire = "/Run"+str(i+8)+"/"
os.chdir(dire)
p3 = subprocess.Popen(['./mej'])
exit_codes = [p.wait() for p in p1, p2, p3, p4, p5, p6, p7, p8]
i = i + 8
print "Job's done!"
现在这首先很好用,但是我只是改变了一个可变的时间步骤,这样做每次集成运行的时间差别很大。现在的问题是,在启动一组新的集成之前,脚本将等待最慢的脚本完成。如何编写它以便我总是运行8个实例?
答案 0 :(得分:2)
您可以使用线程池来保持所有CPU忙:
#!/usr/bin/env python
import os
import subprocess
from multiprocessing.pool import ThreadPool
def run(i):
working_dir = "dir/Run/" + str(i + 1)
return i, subprocess.call(os.path.join(working_dir, 'mej'), cwd=working_dir)
results = ThreadPool().map(run, range(n))
只要一个mej
进程完成,就会启动下一个进程。一次只能运行os.cpu_count()
个并发工作进程。
答案 1 :(得分:0)
虽然给定运行的执行时间可能显着不同,但通常可以安全地假设由例如10次连续运行的差异要小得多。
所以简单的解决方案 A 是启动8个进程,每个进程调用外部程序10次,然后等待这些进程完成。你仍然需要等待最慢的过程,但开销会相当小。
当然有一个明显的解决方案 B :创建一个暂挂运行池,其中有8个进程在完成当前运行后从池中选择一个新运行。这将真正最小化ovehead,但你必须在这里处理同步原语。
以下是这三种方法的小例子(您使用的方法和我正在谈论的两种方法):
小红色方块显示了改善空间。基本上,方法 A 可以避免在每次运行后停止每个线程。方法 B 甚至更进一步,并使已完成所有运行的线程从另一个线程中获取一个。
答案 2 :(得分:0)
你可以写一些类似的东西。定义运行总数和可用核心数,以及检查是否完成的延迟。对于延迟,只需输入合理的秒数即可。如果一个过程平均在10分钟内运行,那么60秒或更短的延迟就足够了。
import subprocess
import time
import os
def runIt(rootDir, prog, i):
dire = "dir/Run/" + str(i + 1)
os.chdir(dire)
return subprocess.Popen(['./mej'])
n=16 #total number of runs
nProc = 8 # number of cores
i = 0
delay = 2 #delays in second to check if one has returned
pList = [runIt(p) for p in range(min(nProc, n))]
i = len(pList)
while(i<n):
time.sleep(delay) # delays for delay seconds
for j in range(len(pList)):
pList[j].poll()
if pList[j].returncode is not None and i<n:
pList[j] = runIt(i)
i = i+1
print "Job's done!"