cublas如何实现异步标量变量传输

时间:2014-02-13 22:03:37

标签: cuda cublas

在许多cublas或cusparse函数调用中,它们使用标量变量,我们可以在主机指针或设备指针中传递,例如alpha和beta变量 http://docs.nvidia.com/cuda/cublas/#cublas-lt-t-gt-gemm

这是如何实际实现的?如果数据在主机中,我认为它需要在设备上分配内存,然后调用cudaMemcpyAsync来复制数据。但是,执行cudaMalloc会使函数调用同步。我们怎样才能解决这个问题?

1 个答案:

答案 0 :(得分:2)

如果它是一个主机驻留标量,它可以通过值作为内核参数传递。如果它是设备驻留的,那么指向它的指针可以作为内核参数传递。