在C ++中编写OpenCL主机程序时,我们使用以下API来调用OpenCL内核:
cl_int clEnqueueNDRangeKernel ( cl_command_queue command_queue,
cl_kernel kernel,
cl_uint work_dim,
const size_t *global_work_offset,
const size_t *global_work_size,
const size_t *local_work_size,
cl_uint num_events_in_wait_list,
const cl_event *event_wait_list,
cl_event *event)
这里第三个参数设置工作维度。在使用pyopencl的python中,我们将内核称为程序的一部分:
<program_name>.<kernel_name>( <command_queue>, <Global_work_size>,
<Local_work_size>, <Parameters_to_kernel.....> )
例如:
event = program.square( queue, A.shape, None,
A_buf, B_buf, cl.LocalMemory( A.size), np.int32(COUNT) )
那么如何使用pyopencl在
答案 0 :(得分:2)
你没有。在C / C ++ OpenCL API中传递work_dim
,以便库可以知道一维数组global_work_offset
等的大小;在PyOpenCL中,这些大小可以从作为global_size
,local_size
和global_offset
传递的对象推断出来。