标签: matrix gpgpu cublas magma
我正在构建一个内核,其中包括使用Magma函数magma_dgeqrf2_gpu来执行QR分解。这将上三角矩阵R输出到GPU设备上的一般矩阵d_A中。
不将d_A传回主机(因为我需要GPU进行进一步的操作),是否有一种lib方法可以将d_A减少或提取到设备上的上三角矩阵R中?
答案 0 :(得分:0)
这有点傻但我发现解决方案只是使用magmablas_dlacopy()并设置属性以将上三角矩阵复制到设备上的另一个矩阵(已设置为0)。