我正在尝试将我的模拟参数设置在常量内存中,但没有运气(CUDA.NET)。 cudaMemcpyToSymbol函数返回cudaErrorInvalidSymbol。 cudaMemcpyToSymbol中的第一个参数是字符串......它是符号名吗?我不明白它是如何解决的。任何帮助表示赞赏。
//init, load .cubin
float[] arr = new float[1];
arr[0] = 0.0f;
int size = Marshal.SizeOf(arr[0]) * arr.Length;
IntPtr ptr = Marshal.AllocHGlobal(size);
Marshal.Copy(arr, 0, ptr, arr.Length);
var error = CUDARuntime.cudaMemcpyToSymbol("param", ptr, 4, 0, cudaMemcpyKind.cudaMemcpyHostToDevice);
我的.cu文件包含
__constant__ float param;
工作解决方案
cuda.LoadModule(Path.Combine(Environment.CurrentDirectory, "name.cubin"));
simParams = cuda.GetModuleGlobal("params");
float[] parameters = new float[N]{...}
cuda.CopyHostToDevice<float>(simParams, parameters);
答案 0 :(得分:4)
不幸的是,__常量__必须与符号的memcpy在同一文件范围内,在你的情况下,你的__常量__在一个单独的.cu文件中。
解决这个问题的简单方法是在.cu文件中提供包装函数,例如:
__constant__ float param;
// Host function to set the constant
void setParam(float value)
{
cudaMemcpyToSymbol("param", ptr, 4, 0, cudaMemcpyHostToDevice);
}
// etc.
__global__ void ...
答案 1 :(得分:1)
常量内存具有隐式本地范围链接。
确保声明与您使用它的文件位于同一文件中。听起来你有两个文件。
可能还必须将param
声明为数组(或可能不是)
答案 2 :(得分:1)
如果这个问题是实际问题,您可以使用 cuModuleGetGlobal 和下一个 cudaMemcpy :
private bool setValueToSymbol(CUmodule module, string symbol, int value)
{
CUdeviceptr devPtr = new CUdeviceptr();
uint lenBytes = 0;
CUResult result = CUDADriver.cuModuleGetGlobal(ref devPtr, ref lenBytes, module, symbol);
if (result == CUResult.Success)
{
int[] src = new int[] { value };
cudaError error = CUDARuntime.cudaMemcpy(devPtr, src, lenBytes, cudaMemcpyKind.cudaMemcpyHostToDevice);
if (error == cudaError.cudaSuccess)
return true;
else
return false;
}
else
{
return false;
}
}
其中CUmodule module = cuda.LoadModule(“MyCode.cubin”); 此代码适用于NVIDIA GPU Computing SDK 3.1和CUDA.NET 3.0。