修改多处理池的管理器dict中的列表

时间:2016-08-01 16:37:56

标签: python dictionary multiprocessing python-multiprocessing multiprocessing-manager

我有一个元素列表,我在多处理apply_async任务中处理这些元素,并使用管理器字典中的一个键逐个处理逐个处理的元素,我想要映射整个列表。

我尝试了以下代码:

#!/usr/bin/python

from multiprocessing import Pool, Manager

def spammer_task(d, my_list):
    #Initialize manager dict
    d['task'] = {
        'processed_list': []
    }

    for ele in my_list:
        #process here
        d['task']['processed_list'].append(ele)

    return

p = Pool()
m = Manager()
d = m.dict()

my_list = ["one", "two", "three"]

p.apply_async(spammer_task (d, my_list))
print d

最后它只是在dict中发布空列表。 输出:

  

{'任务':{'processed_list':[]}}

现在经过一些研究后,我知道经理dict中的元素变得不可变,所以你必须用新数据重新初始化整个dict才能更新它。所以我尝试了下面的代码,它给出了一个奇怪的错误。

#!/usr/bin/python

from multiprocessing import Pool, Manager

def spammer_task(d, my_list):
    #Initialize manager dict
    d['task'] = {
        'processed_list': []
    }

    for ele in my_list:
        #process here
        old_list = d['task']['processed_list']
        new_list = old_list.append(ele)
        #Have to do it this way since elements inside a manager dict become
        #immutable so
        d['task'] = {
            'processed_list': new_list
        }

    return

p = Pool()
m = Manager()
d = m.dict()

my_list = ["one", "two", "three"]

p.apply_async(spammer_task (d, my_list))
print d

输出:

  

追踪(最近一次调用最后一次):文件“./a.py”,第29行,中          p.apply_async(spammer_task(d,my_list))文件“./a.py”,第14行,在spammer_task中       new_list = old_list.append(ele)AttributeError:'NoneType'对象没有属性'append'

不知何故,似乎将None附加到列表中,我无法弄清楚原因。

2 个答案:

答案 0 :(得分:1)

https://bugs.python.org/issue6766

处遵守解决方案

以下代码修复它,通过复制整个任务dict,然后修改它并重新复制它

GuidedStepFragments

输出:

  

{'task':{'processed_list':['one','two','three']}}

答案 1 :(得分:1)

除了确保d在打印时确实包含某些内容时,结果仍为{'task': {'processed_list': ['one', 'two', 'three']}}

#!/usr/bin/python

from multiprocessing import Pool

def spammer_task(my_list):
    #Initialize manager dict
    out= {
        'processed_list': []
    }

    for ele in my_list:
        #process here
        out['processed_list'].append(ele)

    return 'task',out



my_list = ["one", "two", "three"]

if __name__=="__main__":

    p = Pool()
    d=dict(p.imap_unordered(spammer_task, [my_list])) #this line blocks until finished
    print d