Question

我正在使用PyOpenCL编写OpenCL代码。我的内核程序有一个输入为float2。

__kernel void   Pack_Cmplx( __global float2* Data_In, __global float2* Data_Out, int  N)

我需要在python中声明一个缓冲区来存储输出并传递内核的输入。

python中float2的等效数据类型是什么？我在numpy上尝试了dtype并没有成功:(

Answer 1

这是在pyOpenCL程序中使用float2的MWE：

import numpy as np

###################################################
# openCL libraries
###################################################
import pyopencl as cl
import pyopencl.array as cl_array


deviceID = 0
platformID = 0
workGroup=(1,1)

N = 10
testData = np.zeros(N, dtype=cl_array.vec.float2)

dev = cl.get_platforms()[platformID].get_devices()[deviceID]

ctx = cl.Context([dev])
queue = cl.CommandQueue(ctx)
mf = cl.mem_flags
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)


prg = cl.Program(ctx, """

    __kernel void   Pack_Cmplx( __global float2* Data_In, int  N)
    {
      int gid = get_global_id(0);

      Data_In[gid] = 1;
    }
     """).build()

prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))
cl.enqueue_copy(queue, testData, Data_In)


print testData

我希望有所帮助。

Answer 2

使用cl_array.vec.float2的另一种方法是使用np.float32类型并使你的numpy（和opencl）缓冲区大两倍。

testData = np.zeros(N*2, dtype=np.float32)
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)
prg = cl.Program(ctx, """
    __kernel void   Pack_Cmplx( __global float2* Data_In, int  N)
    {
      int gid = get_global_id(0);
      Data_In[gid] = 1; // not sure about this tbh. do we set both values to 1 here ?
    }
     """).build()
prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))

如何在pyopencl中使用float2？

2 个答案: