我在C
中创建了以下结构'数据'typedef struct data
{
double *dattr;
int d_id;
int bestCent;
}Data;
'dattr'是上述结构中保持动态的数组。 假设我必须创建10个以上结构的对象。即。
dataNode = (Data *)malloc (sizeof(Data) * 10);
并且对于这个结构的每个对象,我必须使用以下命令在C中为数组'dattr'重新分配内存:
for(i=0; i<10; i++)
dataNode[i].dattr = (double *)malloc(sizeof(double) * 3);
在OpenCL中如何实现相同的功能?一旦为结构对象分配内存,如何为数组'dattr'分配内存?
答案 0 :(得分:5)
如果您希望使用纹理内存,则必须使用clCreateBuffer(或clCreateImage2D / 3D在主机线程中执行OpenCL设备(例如,GPU)中的内存分配。这些函数允许您自动将主机数据(例如使用malloc创建)复制到设备,但我通常更喜欢明确使用clEnqueueWriteBuffer / clEnqueueMapBuffer(或clEnqueueWriteImage / clEnqueueMapImage如果使用纹理内存),那么我可以分析数据传输。这是一个例子:
#define DATA_SIZE 1000
typedef struct data {
cl_uint id;
cl_uint x;
cl_uint y;
} Data;
...
// Allocate data array in host
size_t dataSizeInBytes = DATA_SIZE * sizeof(Data);
DATA * dataArrayHost = (DATA *) malloc(dataSizeInBytes);
// Initialize data
...
// Create data array in device
cl_mem dataArrayDevice = clCreateBuffer(context, CL_MEM_READ_ONLY, dataSizeInBytes, NULL, &status );
// Copy data array to device
status = clEnqueueWriteBuffer(queue, dataArrayDevice, CL_TRUE, 0, dataSizeInBytes, &dataArrayHost, 0, NULL, NULL );
// Make sure to pass dataArrayDevice as kernel parameter
// Run kernel
...
您需要考虑的是在执行OpenCL内核之前需要了解OpenCL内核的内存要求。因此,如果在内核执行之前(即在主机中)执行,则存储器分配可以是动态的。没有什么可以阻止你多次调用内核,并且在每个时间调整(分配)内核内存需求。
考虑到这一点,我建议你重新考虑接近问题的方式。首先,使用结构数组比使用数组结构更简单(但不一定更有效)(在这种情况下,数组必须具有固定大小)。
这只是为了让您了解OpenCL的工作原理。看一下Khronos OpenCL resource page,它有很多OpenCL教程和示例,Khronos OpenCL page,它有正式的OpenCL参考,手册页和快速参考卡。
答案 1 :(得分:2)
正如Faken所建议的,如果你关心动态内存分配并且你急于改变算法,这里有一些提示:
以下代码动态分配本地内存空间并将其作为第8个参数传递给OpenCL内核:
int N; //Number_of_data_points, which will keep on changing as per your requirement
size_t localMemSize = ( N* sizeof(int));
...
// Dynamically allocate local memory (allocated per workgroup)
clSetKernelArg(kernel, 8, localMemSize, NULL);