OpenCL get_local_id()永远不会返回0?

时间:2016-03-13 20:07:05

标签: c opencl local gpgpu nvidia

我正在使用OpenCL / OpenGL Interop开发一个基本的光线跟踪器。我在内核中存在一些问题,这些内核共享工作组内共享的本地内存。

这是内核:

__kernel void ComputeDirectionalShadowTexture(
    write_only image2d_t shadowTexture,
    read_only image2d_t positionTexture,
    __constant float3* lightDirection, __constant float4* spheres,
    )
{
    __local bool* shadowReduce[2];
    __local size_t idX, idY, idZ, localID;
    idX = get_global_id(0);
    idY = get_global_id(1);
    idZ = get_global_id(2);

    localID = get_local_id(2);

    //...Read Textures
    //...Perform Computation

    //...Write results
    if(shadowReduce[localID])
        write_imagef(shadowTexture, threadCoord.xy, (float4)(1.0f, 0.0f, 0.0f, 1.0f));
}

运行时,就好像get_local_id()函数永远不会返回0(或只返回1)。

我希望问题与我调用内核的方式有关:

size_t numGlobal[3] =
{
    rBuffer->textureWidth,
    rBuffer->textureHeight,
    numSpheres
};
size_t numLocal[3] = { 1, 1, numSpheres};

cl_event execution;

//Execute kernel
clError = clEnqueueNDRangeKernel
(
    buffer->clQueue,
    members->directionalShadowKernel,
    3,
    NULL,
    &numGlobal,
    &numLocal,
    numBeforeExecution,
    completeBeforeExecution,
    &execution
);

其中numSpheres是一个设为2的常量。

感谢任何/所有反馈。

1 个答案:

答案 0 :(得分:5)

我在上面的代码中犯了一个菜鸟错误,如果有人遇到过这个问题,请确保你没有像我在这里那样将get_local_id()的结果分配给__local访问限定变量:< / p>

localID = get_local_id(2);

当然,本地变量会被工作组中的每个线程覆盖,因为本地地址空间在工作组中共享。

所以不要将localID声明为:

__local size_t localID;

应该声明为:

size_t localID;

希望这有助于某人。