Python在并行进程之间共享字典

时间:2012-06-13 23:50:53

标签: python multiprocessing

我想在我的流程之间共享字典,如下所示:

def f(y,x):
    y[x]=[x*x]                                                          

if __name__ == '__main__':
    pool = Pool(processes=4)
    inputs = range(10)
    y={}                             
    result = pool.map(f,y,inputs)

y返回{}。我怎样才能使它发挥作用?

谢谢,

1 个答案:

答案 0 :(得分:11)

这看起来像是在使用multiprocessing模块。你没有说,这是一个重要的信息。

.map()实例上的multiprocessing.Pool()函数有两个参数:一个函数和一个序列。将使用序列中的连续值调用该函数。您正在尝试传递y和序列,但这不起作用。

你可以创建一个这样的序列:((y, x) for x in input),然后编写一个带有一个参数,一个元组的函数,然后用它做正确的事。

我只使用multiprocessing.Pool()来运行读取和写入磁盘文件的进程,所以我不确定基本概念在这里是如何工作的:我不确定你是否能像你这样改变一个dict试图做。

我建议您只从函数中传回值,然后收集它们以获得最终结果。我刚刚测试了这段代码并且有效:

import multiprocessing as mp

def f(x):
    return (x, x*x)

if __name__ == '__main__':
    pool = mp.Pool()
    inputs = range(10)
    result = dict(pool.map(f, inputs))

result设置为:{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

让我们改变它,以便不是计算x*x而是将x提升到某种力量,并且会提供力量。让我们来看一个字符串键参数。这意味着f()需要采用元组参数,其中元组将为(key, x, p)并且它将计算x**p

import multiprocessing as mp

def f(tup):
    key, x, p = tup  # unpack tuple into variables
    return (key, x**p)

if __name__ == '__main__':
    pool = mp.Pool()
    inputs = range(10)
    inputs = [("1**1", 1, 1), ("2**2", 2, 2), ("2**3", 2, 3), ("3**3", 3, 3)]
    result = dict(pool.map(f, inputs))

如果您有多个序列,并且需要将它们连接在一起以制作上述序列,请查看使用zip()itertools.product