CUDA中共享内存的本地指针

时间:2012-05-14 14:18:12

标签: cuda

如何让线程块中的每个线程都有自己的指向共享内存的指针?我找到了一些声明这种指针的例子:

int __shared__ *p;
__shared__ int array[256];

p = &array[threadId];

这是对的还是有另一种方式?

2 个答案:

答案 0 :(得分:4)

不,这不是正确的方法。在该示例代码中,p是共享的,因此它意味着块中的每个线程都将尝试访问同一块内存。如果threadId是带有块的唯一线程索引,则可以这样做:

int *p;
__shared__ int array[256];

p = &array[threadId];

在这种情况下,编译器将使用寄存器或线程本地内存来为块中的每个线程在静态共享内存分配array中存储元素的唯一地址。

答案 1 :(得分:-1)

你是对的。更好的方法是动态分配共享内存。一个例子是作为研究员:

void __global__ test(){
extern __shared__ int s[];
int *p = &s[xx];

}

...
test<<<x,y, shared memory length>>>();
...