如何在pyopencl中使用float2?

时间:2014-02-13 05:25:03

标签: python opencl pyopencl

我正在使用PyOpenCL编写OpenCL代码。我的内核程序有一个输入为float2。

__kernel void   Pack_Cmplx( __global float2* Data_In, __global float2* Data_Out, int  N)

我需要在python中声明一个缓冲区来存储输出并传递内核的输入。

python中float2的等效数据类型是什么?我在numpy上尝试了dtype并没有成功:(

2 个答案:

答案 0 :(得分:1)

这是在pyOpenCL程序中使用float2的MWE:

import numpy as np

###################################################
# openCL libraries
###################################################
import pyopencl as cl
import pyopencl.array as cl_array


deviceID = 0
platformID = 0
workGroup=(1,1)

N = 10
testData = np.zeros(N, dtype=cl_array.vec.float2)

dev = cl.get_platforms()[platformID].get_devices()[deviceID]

ctx = cl.Context([dev])
queue = cl.CommandQueue(ctx)
mf = cl.mem_flags
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)


prg = cl.Program(ctx, """

    __kernel void   Pack_Cmplx( __global float2* Data_In, int  N)
    {
      int gid = get_global_id(0);

      Data_In[gid] = 1;
    }
     """).build()

prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))
cl.enqueue_copy(queue, testData, Data_In)


print testData

我希望有所帮助。

答案 1 :(得分:1)

使用cl_array.vec.float2的另一种方法是使用np.float32类型并使你的numpy(和opencl)缓冲区大两倍。

testData = np.zeros(N*2, dtype=np.float32)
Data_In = cl.Buffer(ctx, mf.READ_WRITE, testData.nbytes)
prg = cl.Program(ctx, """
    __kernel void   Pack_Cmplx( __global float2* Data_In, int  N)
    {
      int gid = get_global_id(0);
      Data_In[gid] = 1; // not sure about this tbh. do we set both values to 1 here ?
    }
     """).build()
prg.Pack_Cmplx(queue, (N,1), workGroup, Data_In, np.int32(N))