我用cudafy测试了一些GPU计算样本
我有代码计算/ creta数据集合,我希望每个循环对集合中的每个对象做一些GPU操作 代码:
public override void CountData(List<IData<int>> datas)
{
for (int i = 0; i < datas.Count; i++)
{
Execute(datas[i]);
}
}
public static void Execute(IData<int> data)
{
CudafyModule km = CudafyTranslator.Cudafy();
GPGPU gpu = CudafyHost.GetDevice(CudafyModes.Target, CudafyModes.DeviceId);
gpu.LoadModule(km);
int c;
int[] dev_c = gpu.Allocate<int>(); // cudaMalloc one Int32
gpu.Launch().add(data.IntData[0], data.IntData[1], dev_c); // or gpu.Launch(1, 1, "add", 2, 7, dev_c);
gpu.CopyFromDevice(dev_c, out c);
Console.WriteLine(c + ";");
gpu.Free(dev_c);
chromozome.Result= c;
}
[Cudafy]
public static void add(int a, int b, int[] c)
{
c[0] = a + b;
}
此代码适用于CountData的第一次调用,但在Count数据循环结束程序停止并且控制台输出后显示
线程0xf50已退出,代码为259(0x103)。 线程0x10c已退出代码259(0x103)。 线程0xc30已退出代码259(0x103)。 线程0xcc0已退出,代码为0(0x0)。 线程0x548已退出,代码为0(0x0)。
让enybody知道哪里可能有问题?我尝试gpu.Synchronize,CudafyHost.ClearDevices(),但它始终以此错误结束 谢谢你的帮助
编辑:经过一些测试我发现
gpu.Launch().add(5, 3, dev_c);
工作但是:
gpu.Launch().add(data.IntData[0], data.IntData[1], dev_c);
不是
答案 0 :(得分:0)
Tahnks对Hans Passant说这根本不是问题而且gpu卡应该可以解决问题。我在代码的其他部分发现错误。所以上面的代码工作正常。