我的前馈神经网络中的以下行计算L2正则化项:
self.L2_reg = tt.sum([tt.sum(P ** 2) for P in self.params])
P在这里是通常的theano符号矩阵变量。在训练期间,内存使用量不断增加。 L1规范也是如此。但是,当我根本不应用任何elemtwise操作时,没有内存问题:
self.L2_reg = tt.sum([tt.sum(P) for P in self.params])
怎么会这样?我在Windows机器上使用theano 0.9和Python 3.5。感谢任何帮助。
答案 0 :(得分:0)
Theano版本0.9.0有一个已知的内存泄漏问题。作为一种解决方法,您可以暂时回归到版本0.8.2,这将正常工作。