我正在尝试使用部分函数,以便pool.map()可以定位具有多个参数的函数(在本例中为Lock()对象)。
以下是示例代码(取自我之前的一个问题的答案):
from functools import partial
def target(lock, iterable_item):
for item in items:
# Do cool stuff
if (... some condition here ...):
lock.acquire()
# Write to stdout or logfile, etc.
lock.release()
def main():
iterable = [1, 2, 3, 4, 5]
pool = multiprocessing.Pool()
l = multiprocessing.Lock()
func = partial(target, l)
pool.map(func, iterable)
pool.close()
pool.join()
然而,当我运行此代码时,我收到错误:
Runtime Error: Lock objects should only be shared between processes through inheritance.
我在这里缺少什么?如何在子进程之间共享锁定?
答案 0 :(得分:72)
对不起,我应该在回答你的其他问题时发现这一点。您无法将普通multiprocessing.Lock
对象传递给Pool
方法,因为它们无法被腌制。有两种方法可以解决这个问题。一种是创建Manager()
并传递Manager.Lock()
:
def main():
iterable = [1, 2, 3, 4, 5]
pool = multiprocessing.Pool()
m = multiprocessing.Manager()
l = m.Lock()
func = partial(target, l)
pool.map(func, iterable)
pool.close()
pool.join()
但这有点重量级;使用Manager
需要生成另一个进程来托管Manager
服务器。所有对acquire
/ release
锁的调用都必须通过IPC发送到该服务器。
另一个选项是使用multiprocessing.Lock()
kwarg在池创建时传递常规initializer
。这将使您的锁实例在所有子工作者中全局:
def target(iterable_item):
for item in items:
# Do cool stuff
if (... some condition here ...):
lock.acquire()
# Write to stdout or logfile, etc.
lock.release()
def init(l):
global lock
lock = l
def main():
iterable = [1, 2, 3, 4, 5]
l = multiprocessing.Lock()
pool = multiprocessing.Pool(initializer=init, initargs=(l,))
pool.map(target, iterable)
pool.close()
pool.join()
第二种解决方案具有不再需要partial
的副作用。
答案 1 :(得分:0)
这是一个版本(使用Barrier
而不是Lock
,但您知道了),该版本也可以在Windows上使用(缺少的fork
会造成其他麻烦):>
import multiprocessing as mp
def procs(uid_barrier):
uid, barrier = uid_barrier
print(uid, 'waiting')
barrier.wait()
print(uid, 'past barrier')
def main():
N_PROCS = 10
with mp.Manager() as man:
barrier = man.Barrier(N_PROCS)
with mp.Pool(N_PROCS) as p:
p.map(procs, ((uid, barrier) for uid in range(N_PROCS)))
if __name__ == '__main__':
mp.freeze_support()
main()