如何为初学者使用恒定记忆(Cuda C)

时间:2015-03-11 13:10:09

标签: c memory cuda constants

我有3个常量值(ABC),我想保存在常量内存中;我通过输入以下代码行找到了一种方法:

// CUDA global constants
__constant__ int A;
__constant__ int B;
__constant__ int C;

int main(void)
{

    float pA=1;
    float pB=2;
    float pC=3;
    ...
    cudaMemcpyToSymbol(A, &pA, sizeof(A));
    cudaMemcpyToSymbol(B, &pB, sizeof(B));
    cudaMemcpyToSymbol(C, &pC, sizeof(C));
    ...
}

但是我认为这不是最好的方法,因为如果我有更多的常数会变得非常不方便。

这是我的问题:我如何复制上面编写的代码行以获得更紧凑的表单?

1 个答案:

答案 0 :(得分:4)

CUDA中的常量内存是65536字节的专用内存空间。它是专用的,因为它具有一些特殊功能,如缓存和广播。

  

常量内存空间驻留在设备内存中,并缓存在Compute Capability 1.x和Compute Capability 2.x中提到的常量缓存中。

见Sect。 5.3.2。设备内存访问和Sect。 G.4.4。有关详细信息,请参阅“CUDA C编程指南”中的常量内存。

因此,您可以像以前一样为一个元素分配常量内存,也可以为元素数组分配内存。

__constant__ float c_ABC[3]; // 3 elements of type float (12 bytes)

但是,CUDA中不允许动态分配常量内存。因此,您必须像使用一个元素一样将数据从CPU复制到GPU。

float pABC = {1, 2, 3};
...
cudaMemcpyToSymbol(c_ABC, &pABC, 3 * sizeof(float));

您可以在CPU中初始化pABC,例如循环或从文件加载数据,然后将数据复制到GPU的常量内存中。

请注意,我已调整您的示例以使用always floats。