OpenCL内核中的自定义类型

时间:2010-03-11 09:30:21

标签: types opencl gmp

是否可以在OpenCL内核中使用自定义类型,如gmp类型(mpz_t,mpq_t,...)?

要有这样的东西(这个内核不仅仅因为#include <gmp.h>而构建):

#include <gmp.h>
__kernel square(
   __global mpz_t* input,
   __global mpz_t number,
   __global int* output,
   const unsigned int count)
{
   int i = get_global_id(0);
   if(i < count)
       output[i] = mpz_divisible_p(number,input[i]);
}

可能通过向clBuildProgram的第四个参数( options )添加不同的参数?

或者OpenCL是否已经拥有可以处理大型号码的类型?

4 个答案:

答案 0 :(得分:21)

通常,您可以在OpenCL程序中使用任何类型。但由于导入不起作用,您必须在同一程序中重新定义它们。例如:

typedef char my_char[8];

typedef struct tag_my_struct
{
    long int        id;
    my_char         chars[2];
    int             numerics[4]
    float           decimals[4];
} my_struct;

__kernel void foo(__global my_struct * input,
                  __global int * output)
{
    int gid = get_global_id(0);
    output[gid] = input[gid].numerics[3]== 2 ? 1 : 0;
}

但是,您显然需要保持OpenCL内外的定义相同。还要确保类型在设备和主机上具有相同的大小(使用sizeof(my_struct)应该这样做)。在某些情况下,我必须调整定义,以匹配大小。

答案 1 :(得分:7)

我使用VHristov的回答和dietr的评论让我的工作。此代码适用于OpenCL 1.2

<强>内核

typedef struct tag_my_struct{
  int a;
  char b;
}my_struct;

__kernel void myKernel(__global my_struct *myStruct)
{
    int gid = get_global_id(0);
    (myStruct+gid)->a = gid;
    (myStruct+gid)->b = gid + 1;
}

<强>宿主

typedef struct tag_my_struct{
  cl_int a;
  cl_char b;
}my_struct;

void runCode() 
{
    cl_int status = 0;
    my_struct* ms = new my_struct[5];

    cl_mem mem = clCreateBuffer(*context, 0, sizeof(my_struct)*5, NULL, &status);
    clEnqueueWriteBuffer(*queue, mem, CL_TRUE, 0, sizeof(my_struct)*5, &ms, 0, NULL, NULL);

    status = clSetKernelArg(*kernel, 0, sizeof(ms), &mem);

    size_t global[] = {5};
    status = clEnqueueNDRangeKernel(*queue, *kernel, 1, NULL, global, NULL, 0, NULL, NULL);

    status = clEnqueueReadBuffer(*queue, mem, CL_TRUE, 0, sizeof(my_struct)*5, ms, 0, NULL, NULL);

    for(int i = 0; i < 5; i++)
        cout << (ms+i)->a << " " << (ms+i)->b << endl;
}

<强>输出

0☺

1☻

2♥

3♦

4♣

答案 2 :(得分:4)

您可以使用自定义类型,但内核中使用的任何内容都需要专门为OpenCL编写。查看本网站,或许了解如何实现更大的精确数字:FP128

编辑:NVIDIA的CUDA SDK有一个复杂的数字类型,它不是理想的,但可能会给你一些关于它们如何实现的想法,OpenCL应该是类似的。

答案 3 :(得分:3)

如果要将头文件包含到内核文件中,可以将 -l dir 作为参数添加到clBuildProgram,其中 dir 是包含头文件的目录

此处有更多解释:include headers to OpenCL .cl file

来源:http://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clBuildProgram.html