Python,多线程太慢,多进程

时间:2012-01-08 02:44:36

标签: python multithreading pool multiprocess

我是一个多处理新手,

我对线程有所了解,但我需要提高计算速度,希望通过多处理:

  

示例说明:将字符串发送到线程,更改字符串+基准测试,   发回结果进行打印。

from threading import Thread

class Alter(Thread):
    def __init__(self, word):
        Thread.__init__(self)
        self.word = word
        self.word2 = ''

    def run(self):
        # Alter string + test processing speed
        for i in range(80000):
            self.word2 = self.word2 + self.word

# Send a string to be altered
thread1 = Alter('foo')
thread2 = Alter('bar')
thread1.start()
thread2.start()

#wait for both to finish
while thread1.is_alive() == True: pass
while thread2.is_alive() == True: pass


print(thread1.word2)
print(thread2.word2)

目前这需要大约6秒钟,我需要它更快 我一直在研究多处理,找不到与上面代码相​​同的东西。我认为我所追求的是汇集,但我发现的例子很难理解。我想利用所有内核(8个内核)multiprocessing.cpu_count(),但我真的只是有关多处理的有用信息,而不足以复制上面的代码。如果有人能指出我正确的方向或更好的方向,请提供一个非常感谢的例子。 Python 3请

1 个答案:

答案 0 :(得分:6)

只需将threading替换为multiprocessing,将Thread替换为Process。 Pyton中的线程(几乎)从未用于获得性能,因为GIL很糟糕!我在另一个SO-post中解释了它,其中包含一些文档链接和great talk about threading in python.

但是multiprocessing模块有意与线程模块非常相似。您几乎可以将其用作替代品!

多处理模块没有AFAIK提供强制使用特定数量核心的功能。它依赖于操作系统的实现。您可以使用Pool对象并将worker-onjects限制为core-count。或者你可以寻找像pypar这样的其他MPI库。在Linux下,您可以使用shell下的管道在不同的核心上启动多个实例