我正在尝试并行绘图以更快地完成大批量作业。为此,我为我计划制作的每个剧情开始一个主题。
我曾希望每个线程都能完成其绘图并关闭自己(据我所知,当Python通过run()中的所有语句时,Python会关闭线程)。下面是一些显示此行为的代码。
如果创建图形的行被注释掉,它将按预期运行。另一个看似合情合理的消息是,当你只生成一个线程时,它也会按预期运行。
import matplotlib.pyplot as plt
import time
import Queue
import threading
def TapHistplots():
## for item in ['str1']:
# # it behaves as expected if the line above is used instead of the one below
for item in ['str1','str2']:
otheritem = 1
TapHistQueue.put((item, otheritem))
makeTapHist().start()
class makeTapHist(threading.Thread):
def run(self):
item, otheritem = TapHistQueue.get()
fig = FigureQueue.get()
FigureQueue.put(fig+1)
print item+':'+str(fig)+'\n',
time.sleep(1.3)
plt.figure(fig) # comment out this line and it behaves as expected
plt.close(fig)
TapHistQueue = Queue.Queue(0)
FigureQueue = Queue.Queue(0)
def main():
start = time.time()
"""Code in here runs only when this module is run directly"""
FigureQueue.put(1)
TapHistplots()
while threading.activeCount()>1:
time.sleep(1)
print 'waiting on %d threads\n' % (threading.activeCount()-1),
print '%ds elapsed' % (time.time()-start)
if __name__ == '__main__':
main()
任何帮助都得到了适当的赞赏。
答案 0 :(得分:23)
为什么不使用多处理?据我所知,无论如何,线程对你没什么帮助......
Matplotlib已经过线程,因此您可以一次显示多个数字并与之交互。如果您想加速多核机器上的批处理,无论如何都需要多处理。
作为一个基本示例(警告:这将在您运行它的任何目录中创建20个小的.png文件!)
import multiprocessing
import matplotlib.pyplot as plt
import numpy as np
def main():
pool = multiprocessing.Pool()
num_figs = 20
input = zip(np.random.randint(10,1000,num_figs),
range(num_figs))
pool.map(plot, input)
def plot(args):
num, i = args
fig = plt.figure()
data = np.random.randn(num).cumsum()
plt.plot(data)
plt.title('Plot of a %i-element brownian noise sequence' % num)
fig.savefig('temp_fig_%02i.png' % i)
main()
答案 1 :(得分:5)
对于pylab
界面,有一个解决方案Asynchronous plotting with threads。
如果没有pylab
,每个matplotlib的后端可能会有不同的解决方案(Qt,GTK,WX,Tk)。问题是每个GUI工具包都有自己的GUI主循环。您可以看到ipython
如何处理它。