我看到这篇文章指出原子计数器缓冲区与SSBO中的原子变量之间的性能没有差异:
这对nvidia和AMD GPU现在真的如此吗?我想我记得有关Radeon 5870代GPU的原型计数器子集具有更快的支持吗?所以我认为它可能一直是AMD特定的表现?
从nvidia CUDA的知识中我怀疑它对他们没有任何影响吗?
有没有人知道AMD / NVidia原子计数器的哪一代GPU不值得呢?
答案 0 :(得分:1)
Mantle,AMD的低级API,实际上对原子计数器有特定的支持(它们是队列的一部分,而不是内存)。因此,我们完全有理由相信至少有一件硬件不能仅仅使用SSBO。