Python线程没有被垃圾收集

时间:2013-09-04 09:29:07

标签: python multithreading python-multithreading

这是我的线程设置。在我的机器上,最大线程数为2047。

class Worker(Thread):
    """Thread executing tasks from a given tasks queue"""
    def __init__(self, tasks):
        Thread.__init__(self)
        self.tasks = tasks
        self.daemon = True
        self.start()

    def run(self):
        while True:
            func, args, kargs = self.tasks.get()
            try:
                func(*args, **kargs)
            except Exception, e:
                print e
            self.tasks.task_done()

class ThreadPool:
    """Pool of threads consuming tasks from a queue"""
    def __init__(self, num_threads):
        self.tasks = Queue(num_threads)
        for _ in range(num_threads):
            Worker(self.tasks)

    def add_task(self, func, *args, **kargs):
        """Add a task to the queue"""
        self.tasks.put((func, args, kargs))

    def wait_completion(self):
        """Wait for completion of all the tasks in the queue"""
        self.tasks.join()

在我的模块中的其他类中,我从上面调用ThreadPool类 创建一个新的线程池。然后我执行操作。这是一个例子:

def upload_images(self):
    '''batch uploads images to s3 via multi-threading'''
    num_threads = min(500, len(pictures))
    pool = ThreadPool(num_threads)

    for p in pictures:
        pool.add_task(p.get_set_upload_img)

    pool.wait_completion()

我遇到的问题是这些线程没有被垃圾收集。

几次运行后,这是我的错误:

文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/threading.py”,第495行,开头     _start_new_thread(self .__ bootstrap,()) thread.error:无法启动新线程

这意味着我达到了2047的线程限制。

有什么想法吗?感谢。

2 个答案:

答案 0 :(得分:4)

您的工作线程永远不会从run返回,因此您的线程永远不会结束。

您的run方法可能类似以下内容?

def run(self):
    while True:
        try:
            func, args, kargs = self.tasks.get()
        except Queue.Empty:
            break

        try:
            func(*args, **kargs)
        except Exception, e:
            print e

        self.tasks.task_done()

答案 1 :(得分:1)

def run(self):
    while True:
        func, args, kargs = self.tasks.get()
        try:
            func(*args, **kargs)
        except Exception, e:
            print e
        self.tasks.task_done()

它看起来像一个无限循环,这可能是原因吗?所有线程都存活,因此无法收集gc。