我正在使用PyOpenCL编写OpenCL代码。我的内核程序有一个输入为float2。
__kernel void Pack_Cmplx( __global float2* Data_In, __global float2* Data_Out, int N)
我需要在python中声明一个缓冲区来存储输出并传递内核的输入。
python中float2的等效数据类型是什么?我在numpy上尝试了dtype并没有成功:(
答案 0 :(得分:1)
这是在pyOpenCL
程序中使用float2的MWE:
import numpy as np
###################################################
# openCL libraries
###################################################
import pyopencl as cl
import pyopencl.array as cl_array
deviceID = 0
platformID = 0
workGroup=(1,1)
N = 10
testData = np.zeros(N, dtype=cl_array.vec.float2)
dev = cl.get_platforms()[platformID].get_devices()[deviceID]
ctx = cl.Context([dev])
queue = cl.CommandQueue(ctx)
mf = cl.mem_flags
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)
prg = cl.Program(ctx, """
__kernel void Pack_Cmplx( __global float2* Data_In, int N)
{
int gid = get_global_id(0);
Data_In[gid] = 1;
}
""").build()
prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))
cl.enqueue_copy(queue, testData, Data_In)
print testData
我希望有所帮助。
答案 1 :(得分:1)
使用cl_array.vec.float2
的另一种方法是使用np.float32
类型并使你的numpy(和opencl)缓冲区大两倍。
testData = np.zeros(N*2, dtype=np.float32)
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)
prg = cl.Program(ctx, """
__kernel void Pack_Cmplx( __global float2* Data_In, int N)
{
int gid = get_global_id(0);
Data_In[gid] = 1; // not sure about this tbh. do we set both values to 1 here ?
}
""").build()
prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))