标签: cuda gpu matrix-inverse cublas
我是CUDA编程的新手。我必须实现递归算法,其中包括GPU上不同数量的矩阵求逆。目前我在CUBLAS库中使用getrfBatched和getriBatched方法来获得一个矩阵的反转。如果我可以并行实现所有那些矩阵求逆,我想我可以加速整个算法。 谁能建议我解决这个问题?
谢谢