python多处理中的共享变量

时间:2013-06-29 06:30:38

标签: python multiprocessing

第一个问题是Value和Manager()之间有什么区别。值?

第二,是否可以在不使用Value的情况下共享整数变量? 以下是我的示例代码。我想要的是获取一个值为整数的字典,而不是值。我所做的只是在整个过程之后改变它。有没有更简单的方法?

from multiprocessing import Process, Manager

def f(n):
    n.value += 1

if __name__ == '__main__':
    d = {}
    p = []

    for i in range(5):
        d[i] = Manager().Value('i',0)
        p.append(Process(target=f, args=(d[i],)))
        p[i].start()

    for q in p:
        q.join()

    for i in d:
        d[i] = d[i].value

    print d

1 个答案:

答案 0 :(得分:28)

当您使用Value时,您会在共享内存中获得一个ctypes对象,默认情况下会使用RLock进行同步。当您使用Manager时,您将获得一个控制服务器进程的SynManager对象,该对象允许其他进程操纵对象值。您可以使用同一个经理创建多个代理;无需在循环中创建新的管理器:

manager = Manager()
for i in range(5):
    new_value = manager.Value('i', 0)

Manager可以在计算机之间共享,而Value仅限于一台计算机。 Value会更快(运行下面的代码看看),所以我认为你应该使用它,除非你需要支持任意对象或通过网络访问它们。

import time
from multiprocessing import Process, Manager, Value

def foo(data, name=''):
    print type(data), data.value, name
    data.value += 1

if __name__ == "__main__":
    manager = Manager()
    x = manager.Value('i', 0)
    y = Value('i', 0)

    for i in range(5):
        Process(target=foo, args=(x, 'x')).start()
        Process(target=foo, args=(y, 'y')).start()

    print 'Before waiting: '
    print 'x = {0}'.format(x.value)
    print 'y = {0}'.format(y.value)

    time.sleep(5.0)
    print 'After waiting: '
    print 'x = {0}'.format(x.value)
    print 'y = {0}'.format(y.value)

总结:

  1. 使用Manager创建多个共享对象,包括dicts和 名单。使用Manager在网络上的计算机之间共享数据。
  2. 在没有必要共享信息时使用ValueArray 通过网络,ctypes中的类型足以满足您的需求 需求。
  3. ValueManager快。
  4. 警告

    顺便说一下,如果可能的话,应该避免跨进程/线程共享数据。上面的代码可能会按预期运行,但会增加执行foo所需的时间,事情会变得奇怪。将上述内容与以下内容进行比较:

    def foo(data, name=''):
        print type(data), data.value, name
        for j in range(1000):
            data.value += 1
    

    您需要Lock才能使其正常工作。

    我对这一切并不是特别了解,所以也许其他人会出现并提供更多见解。我想我会提供一个答案,因为这个问题没有引起人们的注意。希望有所帮助。