我需要并行执行同一个类的许多实例的方法。为此,我尝试使用Process.start()
模块中的Process.join()
和multiprocessing
命令。
例如对于一个类:
class test:
def __init__(self):
...
...
def method(self):
...
...
其中method
修改了一些类变量。如果我创建了两个类的实例:
t1=test()
t2=test()
执行:
from multiprocessing import Process
pr1=Process(target=t1.method, args=(,))
pr2=Process(target=t2.method, args=(,))
pr1.start()
pr2.start()
pr1.join()
pr2.join()
类的实例变量没有更新(整个代码太长了,不能粘贴在这里,但这是个主意)。
有没有办法实现这个目标? 谢谢
答案 0 :(得分:11)
当您在子进程中调用obj.method
时,子进程将在obj
中获取每个实例变量的单独副本。因此,您在孩子中对他们所做的更改不会反映在父级中。您需要通过multiprocessing.Queue
将更改后的值明确传递回父级,以使更改生效为父级:
from multiprocessing import Process, Queue
q1 = Queue()
q2 = Queue()
pr1 = Process(target=t1.method, args=(q1,))
pr2 = Process(target=t2.method, args=(q2,))
pr1.start()
pr2.start()
out1 = q1.get()
out2 = q2.get()
t1.blah = out1
t2.blah = out2
pr1.join()
pr2.join()
其他选项是制作更改multiprocessing.Value
实例或multiprocessing.Manager
Proxy
实例所需的实例变量。这样,您在子项中所做的更改会自动反映在父项中。但这是以增加在父级中使用变量的开销为代价的。
以下是使用multiprocessing.Manager
的示例。这不起作用:
import multiprocessing
class Test(object) :
def __init__(self):
self.some_list = [] # Normal list
def method(self):
self.some_list.append(123) # This change gets lost
if __name__ == "__main__":
t1 = Test()
t2 = Test()
pr1 = multiprocessing.Process(target=t1.method)
pr2 = multiprocessing.Process(target=t2.method)
pr1.start()
pr2.start()
pr1.join()
pr2.join()
print(t1.some_list)
print(t2.some_list)
输出:
[]
[]
这有效:
import multiprocessing
class Test(object) :
def __init__(self):
self.manager = multiprocessing.Manager()
self.some_list = self.manager.list() # Shared Proxy to a list
def method(self):
self.some_list.append(123) # This change won't be lost
if __name__ == "__main__":
t1 = Test()
t2 = Test()
pr1 = multiprocessing.Process(target=t1.method)
pr2 = multiprocessing.Process(target=t2.method)
pr1.start()
pr2.start()
pr1.join()
pr2.join()
print(t1.some_list)
print(t2.some_list)
输出:
[123]
[123]
请记住,multiprocessing.Manager
启动子进程来管理您创建的所有共享实例,并且每次访问其中一个Proxy
实例时,您实际上都在制作IPC调用Manager
进程。