分配恒定的记忆

时间:2010-03-15 21:15:51

标签: cuda cuda.net gpu-constant-memory

我正在尝试将我的模拟参数设置在常量内存中,但没有运气(CUDA.NET)。 cudaMemcpyToSymbol函数返回cudaErrorInvalidSymbol。 cudaMemcpyToSymbol中的第一个参数是字符串......它是符号名吗?我不明白它是如何解决的。任何帮助表示赞赏。

//init, load .cubin   
float[] arr = new float[1];
    arr[0] = 0.0f;
    int size = Marshal.SizeOf(arr[0]) * arr.Length;
    IntPtr ptr = Marshal.AllocHGlobal(size);
    Marshal.Copy(arr, 0, ptr, arr.Length);
    var error = CUDARuntime.cudaMemcpyToSymbol("param", ptr, 4, 0, cudaMemcpyKind.cudaMemcpyHostToDevice);

我的.cu文件包含

__constant__ float param;

工作解决方案

     cuda.LoadModule(Path.Combine(Environment.CurrentDirectory, "name.cubin"));            
 simParams = cuda.GetModuleGlobal("params");
 float[] parameters = new float[N]{...}             
 cuda.CopyHostToDevice<float>(simParams, parameters);

3 个答案:

答案 0 :(得分:4)

不幸的是,__常量__必须与符号的memcpy在同一文件范围内,在你的情况下,你的__常量__在一个单独的.cu文件中。

解决这个问题的简单方法是在.cu文件中提供包装函数,例如:

__constant__ float param;

// Host function to set the constant
void setParam(float value)
{
  cudaMemcpyToSymbol("param", ptr, 4, 0, cudaMemcpyHostToDevice);
}

// etc.
__global__ void ...

答案 1 :(得分:1)

常量内存具有隐式本地范围链接。 确保声明与您使用它的文件位于同一文件中。听起来你有两个文件。 可能还必须将param声明为数组(或可能不是)

答案 2 :(得分:1)

如果这个问题是实际问题,您可以使用 cuModuleGetGlobal 和下一个 cudaMemcpy

private bool setValueToSymbol(CUmodule module, string symbol, int value)
{
    CUdeviceptr devPtr = new CUdeviceptr();
    uint lenBytes = 0;
    CUResult result = CUDADriver.cuModuleGetGlobal(ref devPtr, ref lenBytes, module, symbol);
    if (result == CUResult.Success)
    {
        int[] src = new int[] { value };
        cudaError error = CUDARuntime.cudaMemcpy(devPtr, src, lenBytes, cudaMemcpyKind.cudaMemcpyHostToDevice);
        if (error == cudaError.cudaSuccess)
            return true;
        else
            return false;
    }
    else
    {
        return false;
    }
}

其中CUmodule module = cuda.LoadModule(“MyCode.cubin”); 此代码适用于NVIDIA GPU Computing SDK 3.1和CUDA.NET 3.0。