我在OpenCL内核中处理一个向量,并在另一个向量中输出结果。它发生在多个输入向量元素可以在同一输出向量元素中输出。
代码目前无效,我想知道这是否是OpenCL计算的已知限制。
this.stack = new double[default_capacity];
从内核可以看出,处理每个粒子位置p_pos [i](模拟中约为3000)以产生其单元格索引c_idx(总共大约1000个单元格)。
然后递增cell_number_of_particles [c_idx]以记住粒子在细胞中的存在。并且一些粒子将增加相同的细胞指数。