Question

我刚开始使用pyopencl模块在python中查看OpenCl。

我感兴趣的是生成没有任何输入的东西，例如生成正弦波的样本。

要做到这一点，我所需要的只是进行计算的全局id，但是返回全局id结果会产生一些奇特的数字。我使用下面的代码：

import numpy as np
import pyopencl as cl

Size = Width*Height

# Get platforms, both CPU and GPU
plat = cl.get_platforms()
GPU = plat[0].get_devices()

#Create context for GPU
ctx = cl.Context(GPU)

# Create queue for each kernel execution
queue = cl.CommandQueue(ctx)

mf = cl.mem_flags

# Kernel function
src = '''
__kernel void shader(__global float *result, __global int *width){

int w = *width;
size_t gid = get_global_id(0);

result[gid] = gid;
}
'''

#Kernel function instantiation
prg = cl.Program(ctx, src).build()

#Allocate memory for variables on the device
width_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=np.int32(Width))
result_g = cl.Buffer(ctx, mf.WRITE_ONLY, Size*8)

# Call Kernel. Automatically takes care of block/grid distribution
prg.shader(queue, (Size,), None , result_g, width_g)
result = np.empty((Size,))
cl.enqueue_copy(queue, result, result_g)

Image = result

我所做的就是将全局ID复制到缓冲区对象 result_d ，但是当我检查结果时，我会得到一些甚至不是整数的数字。我也尝试将缓冲区设置为整数而不是浮点数，但结果仍然相同。

我做错了什么？

Answer 1

问题是OpenCL内核中的result类型为float，主机端的result类型为double。

指定主机缓冲区为float以解决问题：

result = np.empty((Size,),dtype=np.float32)

使用OpenCl Global ID作为内核中的整数

1 个答案: