我建立了一个神经网络,需要使用Cholesky分解并解决三角系统作为其计算的一部分。这意味着我还需要计算整个计算的梯度。
当我尝试编译代码时,我收到错误“No Cula available”。不幸的是,我无法从website下载Cula。
我想知道是否可以将CPU和GPU与theano混合使用。我需要使用Cholesky和Solve的矩阵很小(100x100),所以我可以在CPU上做这个部分。但是,要做到这一点,我需要在GPU计算后立即将矩阵传输到CPU,然后将结果发送回GPU。是否有可能透明地做到这一点?
答案 0 :(得分:1)
此转移是透明的。不需要做一些特别的事情。但我建议您分析Theano图表,以确保:http://deeplearning.net/software/theano/tutorial/profiling.html#tut-profiling
对于cula,有一个PR根据NVIDIA现在提供的cusolver提供解决方案。所以这可能不再需要了。试试这个PR:https://github.com/Theano/Theano/pull/4917