python多处理分割迭代器的更好方法

时间:2014-04-10 00:32:57

标签: python python-3.x multiprocessing

目前我正在进行多处理计数,我试图通过迭代器来计算大量推文中的主题标签我知道这些迭代器中有多少值(计数本身是在{{1 }} 方法)。目前我循环遍历迭代器并在我们点击数据块后将其值存储在列表中我启动了一个工作线程,该线程将调用worker方法并清除列表。我一直这样做,直到我们在迭代器中耗尽数据。

worker

有更好的方法吗?我的问题是我需要将迭代器转换为可能不适合内存的较小列表!

1 个答案:

答案 0 :(得分:2)

除非您特别希望每个工作人员处理连续的推文间隔,否则您可以考虑另一种方法:

创建队列。同时启动所有工作线程。从spaceTimeTweetConnection读取主线程并将它们写入队列。让工作线程从队列中读取。

队列是线程安全的,因此它将在内部管理同时读取。