并行执行类方法

时间:2014-10-07 15:29:42

标签: python multiprocessing

我需要并行执行同一个类的许多实例的方法。为此,我尝试使用Process.start()模块中的Process.join()multiprocessing命令。

例如对于一个类:

class test:
     def __init__(self):
     ...
     ...
     def method(self):
     ...
     ...

其中method修改了一些类变量。如果我创建了两个类的实例:

t1=test()
t2=test()

执行:

from multiprocessing import Process
pr1=Process(target=t1.method, args=(,))
pr2=Process(target=t2.method, args=(,))
pr1.start()
pr2.start()
pr1.join()
pr2.join()

类的实例变量没有更新(整个代码太长了,不能粘贴在这里,但这是个主意)。

有没有办法实现这个目标? 谢谢

1 个答案:

答案 0 :(得分:11)

当您在子进程中调用obj.method时,子进程将在obj中获取每个实例变量的单独副本。因此,您在孩子中对他们所做的更改不会反映在父级中。您需要通过multiprocessing.Queue将更改后的值明确传递回父级,以使更改生效为父级:

from multiprocessing import Process, Queue
q1 = Queue()
q2 = Queue()
pr1 = Process(target=t1.method, args=(q1,))
pr2 = Process(target=t2.method, args=(q2,))
pr1.start()
pr2.start()
out1 = q1.get()
out2 = q2.get()
t1.blah = out1
t2.blah = out2
pr1.join()
pr2.join()

其他选项是制作更改multiprocessing.Value实例或multiprocessing.Manager Proxy实例所需的实例变量。这样,您在子项中所做的更改会自动反映在父项中。但这是以增加在父级中使用变量的开销为代价的。

以下是使用multiprocessing.Manager的示例。这不起作用:

import multiprocessing

class Test(object) :

    def __init__(self):
       self.some_list = []  # Normal list

    def method(self):
        self.some_list.append(123)  # This change gets lost


if __name__ == "__main__":
    t1 = Test()
    t2 = Test()
    pr1 = multiprocessing.Process(target=t1.method)
    pr2 = multiprocessing.Process(target=t2.method)
    pr1.start()
    pr2.start()
    pr1.join()
    pr2.join()
    print(t1.some_list)
    print(t2.some_list)

输出:

[]
[]

这有效:

import multiprocessing

class Test(object) :

    def __init__(self):
       self.manager = multiprocessing.Manager()
       self.some_list = self.manager.list()  # Shared Proxy to a list

    def method(self):
        self.some_list.append(123) # This change won't be lost


if __name__ == "__main__":
    t1 = Test()
    t2 = Test()
    pr1 = multiprocessing.Process(target=t1.method)
    pr2 = multiprocessing.Process(target=t2.method)
    pr1.start()
    pr2.start()
    pr1.join()
    pr2.join()
    print(t1.some_list)
    print(t2.some_list)

输出:

[123]
[123]

请记住,multiprocessing.Manager启动子进程来管理您创建的所有共享实例,并且每次访问其中一个Proxy实例时,您实际上都在制作IPC调用Manager进程。