我很想尝试使用JCUDA(http://www.jcuda.de),但需要弄清楚如何从我的Java代码调用CUBIN文件,以便我可以使用CUDA在大型数组上执行计算Java程序中的数据,作为赋值的一部分。
我试图遵循“JCudaDriverCubinSample”文件,但我真的很难看到如何修改该示例代码以适用于我自己的CUBIN文件(注意:该示例确实正常运行)。
例如,我正在尝试从.CU文件生成的简单内核:
__global__ void multiply_array( int *a, int *b, int *c, int N ) {
int tid = blockIdx.x * blockDim.x + threadIdx.x;
if (tid < N)
c[tid] = a[tid] * b[tid];
}
这似乎正确构建到CUBIN文件中,但我似乎无法理解我需要对示例代码做出哪些更改以尝试使用驱动程序绑定从JCuda运行。
是否有人能够指出我的解决方案,或指向能够更清楚地解释代码的材料?我发现JCuda网站上的文档相当稀疏(但是如果有很好的资源可以尝试和学习,我真的不会对阅读产生不利影响。)
谢谢!