我试图了解GPU内存中的数据布局。例如,当我们调用cudaMalloc3D
或cudaMalloc
时,数据如何以存储区/行/列的形式布局在内存中?这些信息是否可用?
答案 0 :(得分:1)
据我所知,你要求的所有内容都没有正式记录。
使用malloc区域进行简单的线性内存分配。音调线性存储器是相同的,但具有在运行时确定的音调。音调启发式没有记录。 CUDA数组是一个不透明的数据容器,只能通过纹理或表面API访问。如何将这些映射到硬件上的方法没有记录。
设备的内存布局因硬件版本而异。您可能能够在NVIDIA通常在新架构发布时发布的各种架构白皮书中找到至少一些提示。除此之外,我不认为公共领域还有更多。