我刚开始使用pyopencl模块在python中查看OpenCl。
我感兴趣的是生成没有任何输入的东西,例如生成正弦波的样本。
要做到这一点,我所需要的只是进行计算的全局id,但是返回全局id结果会产生一些奇特的数字。我使用下面的代码:
import numpy as np
import pyopencl as cl
Size = Width*Height
# Get platforms, both CPU and GPU
plat = cl.get_platforms()
GPU = plat[0].get_devices()
#Create context for GPU
ctx = cl.Context(GPU)
# Create queue for each kernel execution
queue = cl.CommandQueue(ctx)
mf = cl.mem_flags
# Kernel function
src = '''
__kernel void shader(__global float *result, __global int *width){
int w = *width;
size_t gid = get_global_id(0);
result[gid] = gid;
}
'''
#Kernel function instantiation
prg = cl.Program(ctx, src).build()
#Allocate memory for variables on the device
width_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=np.int32(Width))
result_g = cl.Buffer(ctx, mf.WRITE_ONLY, Size*8)
# Call Kernel. Automatically takes care of block/grid distribution
prg.shader(queue, (Size,), None , result_g, width_g)
result = np.empty((Size,))
cl.enqueue_copy(queue, result, result_g)
Image = result
我所做的就是将全局ID复制到缓冲区对象 result_d ,但是当我检查结果时,我会得到一些甚至不是整数的数字。我也尝试将缓冲区设置为整数而不是浮点数,但结果仍然相同。
我做错了什么?
答案 0 :(得分:1)
问题是OpenCL内核中的result
类型为float
,主机端的result
类型为double
。
指定主机缓冲区为float
以解决问题:
result = np.empty((Size,),dtype=np.float32)