我设计了一款用于iPad游戏的学习型AI,但它的原型是用matlab编写的。我需要执行几个操作,例如:(capital表示矩阵)
A = B > c;
A = B * C;
A = B' * C;
A = B .* C;
A = B - C;
我的一些矩阵很大(2601 x 100)。在GPU上运行这些操作可以显着提高此操作的性能。是否有一个线性代数库比Accelerate的BLAS更合适? BLAS仅支持最多4x4矩阵。
答案 0 :(得分:5)
我们在使用(开源)Eigen库的前项目中取得了相当不错的成绩。