我正在尝试使用并行化来加速pymc3采样,我认为只有适度的好处。
我能够在i7 MacBook Pro上将总运行时间从25分钟(njobs = 1)减少到13分钟(njobs = 6)。由于pymc实际开始采样需要大约4分钟,因此增加的幅度相对较小。
问题是 - 是否有人成功使用带有pymc3的GPU以及需要6-8分钟采样的模型可以获得多少好处? (我的MacBook有nvidia GT 750M 2Gb)
答案 0 :(得分:6)
我在Intel i7-4930上运行Linux。
我在CPU上运行了90分钟的PyMC3模型(利用所有内核),但我的GeForce GTX 970只用了18分钟。
所以速度提高了近5倍。