在下面的代码中,我首先将名为ref的纹理绑定到全局内存中名为gpu的数组。然后我调用一个名为getVal的函数,其中我首先将gpu [1]的值设置为5,然后使用绑定纹理使用tex1Dfetch(ref,1
)读取它。但是,在这种情况下,tex1Dfetch()不会显示更改的gpu [5]值,而是显示旧值。
然后,我调用另一个名为getagain的函数,它只是再次读取tex1Dfetch(ref,1)。但是,这次我得到了新的价值。我真的不明白为什么在第一个函数中我没有得到改变的值。
#include<cuda_runtime.h>
#include<cuda.h>
#include<stdio.h>
texture<int> ref;
__global__ void getVal(int *c, int *gpu){
gpu[1] = 5;
*c = tex1Dfetch(ref, 1); // returns old value, not 5
}
__global__ void getagain(int *c){
*c = tex1Dfetch(ref, 1); // returns new value !!!????
}
void main(){
int *gpu,*c;
int i,b[10];
for( i =0 ; i < 10; i++){
b[i] = i*3;
}
cudaMalloc((void**)&gpu, sizeof(int) * 10);
cudaBindTexture(NULL, ref, gpu,10*sizeof(int));
cudaMemcpy(gpu, b, 10 * sizeof(int), cudaMemcpyHostToDevice);
cudaMalloc((void**)&c, sizeof(int));
//try changing value and reading using tex1dfetch
getVal<<<1,1>>>(c,gpu);
cudaMemcpy(&i, c,sizeof(int), cudaMemcpyDeviceToHost);
printf("the value returned by tex fetch is %d\n" , i);
cudaMemcpy(b, gpu,10*sizeof(int), cudaMemcpyDeviceToHost);
for( i =0 ; i < 10; i++){
printf("%d\n",b[i]);
}
getagain<<<1,1>>>(c);
cudaMemcpy(&i, c,sizeof(int), cudaMemcpyDeviceToHost);
printf("the value returned by tex fetch is %d\n" , i);
getchar();
}
答案 0 :(得分:3)
在同一内核调用中,纹理缓存不会与全局内存保持一致。请参见“CUDA 4.0 C编程指南”的3.2.10.4节。纹理缓存在连续内核调用之间的一致性是由驱动程序在启动内核之前刷新纹理缓存来实现的。