Python多处理模块:使用超时连接进程

时间:2014-09-26 16:12:21

标签: python timeout python-multiprocessing

我正在优化复杂模拟的参数。我使用多处理模块来增强优化算法的性能。我在http://pymotw.com/2/multiprocessing/basics.html学到的多处理的基础知识。 根据优化算法中给定的参数,复杂模拟持续不同的时间,大约1到5分钟。如果选择的参数非常糟糕,则模拟可持续30分钟或更长时间,结果无效。所以我在考虑在多处理的超时中构建,这会终止所有持续超过定义时间的模拟。这是问题的抽象版本:

import numpy as np
import time
import multiprocessing

def worker(num):

    time.sleep(np.random.random()*20)

def main():

    pnum = 10    

    procs = []
    for i in range(pnum):
        p = multiprocessing.Process(target=worker, args=(i,), name = ('process_' + str(i+1)))
        procs.append(p)
        p.start()
        print 'starting', p.name

    for p in procs:
        p.join(5)
        print 'stopping', p.name

if __name__ == "__main__":
    main()

p.join(5)定义超时5秒。由于for循环for p in procs:,程序等待5秒直到第一个进程完成,然后再等待5秒直到第二个进程完成,依此类推,但我希望程序终止所有持续时间超过5秒。此外,如果所有进程的持续时间都不超过5秒,则程序不得等待5秒钟。

3 个答案:

答案 0 :(得分:8)

如果要杀死所有进程,可以使用多处理池 您需要为所有执行定义一般超时,而不是单个超时。

import numpy as np
import time
from multiprocessing import Pool

def worker(num):
    xtime = np.random.random()*20
    time.sleep(xtime)
    return xtime

def main():

    pnum = 10
    pool = Pool()
    args = range(pnum)
    pool_result = pool.map_async(worker, args)

    # wait 5 minutes for every worker to finish
    pool_result.wait(timeout=300)

    # once the timeout has finished we can try to get the results
    if pool_result.ready():
        print pool_result.get(timeout=1)

if __name__ == "__main__":
    main()

这将为您提供一份清单,其中列出了您所有工人的退货值 更多信息: https://docs.python.org/2/library/multiprocessing.html#module-multiprocessing.pool

答案 1 :(得分:7)

您可以通过创建一个等待超时秒数的循环来执行此操作,经常检查是否所有进程都已完成。如果他们没有在规定的时间内完成任务,那么就终止所有流程:

TIMEOUT = 5 
start = time.time()
while time.time() - start <= TIMEOUT:
    if any(p.is_alive() for p in procs):
        time.sleep(.1)  # Just to avoid hogging the CPU
    else:
        # All the processes are done, break now.
        break
else:
    # We only enter this if we didn't 'break' above.
    print("timed out, killing all processes")
    for p in procs:
        p.terminate()
        p.join()

答案 2 :(得分:1)

感谢dano的帮助,我找到了解决方案:

import numpy as np
import time
import multiprocessing

def worker(num):

    time.sleep(np.random.random()*20)

def main():

    pnum = 10    
    TIMEOUT = 5 
    procs = []
    bool_list = [True]*pnum

    for i in range(pnum):
        p = multiprocessing.Process(target=worker, args=(i,), name = ('process_' + str(i+1)))
        procs.append(p)
        p.start()
        print 'starting', p.name

    start = time.time()
    while time.time() - start <= TIMEOUT:
        for i in range(pnum):
            bool_list[i] = procs[i].is_alive()

        print bool_list

        if np.any(bool_list):  
            time.sleep(.1)  
        else:
            break
    else:
        print("timed out, killing all processes")
        for p in procs:
            p.terminate()

    for p in procs:
        print 'stopping', p.name,'=', p.is_alive()
        p.join()

if __name__ == "__main__":
    main()

它不是最优雅的方式,我确信有比使用bool_list更好的方法。在5秒超时后仍处于活动状态的进程将被终止。如果您在工作器功能中设置的时间比超时时间短,您将看到程序在达到超时5秒之前停止。如果有以下情况,我仍然可以获得更优雅的解决方案:)