标签: cuda
E.g。 CUBLAS包含接受设备或主机指针作为参数的函数(例如,对于cublas< t> gemm()的alpha和beta参数,请参见[1])。如何使用这种功能编写函数?有什么限制?那些具有统一地址空间的设备的角落情况呢?
以正确方式执行此操作的示例源代码将非常棒。
[1] http://docs.nvidia.com/cuda/cublas/index.html#topic_8_1
答案 0 :(得分:3)
CUBLAS中没有魔术指针内省。该库使用显式的每个上下文切换来控制指针的解释方式(参见cudaSetPointerMode)。
cudaSetPointerMode