我正在学习CUDA,我现在有类似的东西。
__device__ void iterate_temperatures(int fieldSize, Atom *atoms) {
int temperature = threadIdx.x + blockDim.x * blockIdx.x;
nAtoms = pow(fieldSize, DIMENSION);
iterate_atoms<<< nAtoms >>>(atoms, nAtoms, temperature);
}
事实是,每个温度都需要最后一个温度。
如何强制每个块等待最后一个块。
谢谢!
答案 0 :(得分:8)
只需拨打__syncthreads()
,就可以完全按照自己的意愿行事。