我必须进行相同的计算(例如,得到A1, A2, ...
)on many(>10^15)
矩阵的特征值,所以我想尽可能多地使用线程。
但我找不到cuBLAS或cuSOLVER代码说明线程数。如果我用for循环和cuSOLVER函数编写代码,cuSOLVER会自动分配资源并并行计算吗?
或者是否有任何cuSOLVER或cuBLAS API,我可以控制线程数和并行化功能?
......
答案 0 :(得分:0)
如果我用for循环和cuSOLVER函数编写代码,cuSOLVER会自动分配资源并并行计算吗?
没有
或者是否有任何cuSOLVER或cuBLAS API可以控制线程数和并行化函数?
没有
但是,如果您想阅读CUSOLVER documentation,您会看到有一个批量稀疏的QR分解例程。 This可用于解决eigenvalue problems。