标签: cuda nvidia
我需要在GPU上进行大量的逐位操作,但无法找到有关Nvidia硬件是大端还是小端的任何信息。
答案 0 :(得分:10)
请参阅:https://devtalk.nvidia.com/default/topic/366773/cuda-programming-and-performance/endian-mode-of-the-device/post/2630674/#2630674
所有受支持的CUDA平台都使用little-endian CPU,而cudaMemcpy()可以在不知道数据格式的情况下将数据结构复制到设备,因此我认为GPU也是小端的。 GPU可能支持大端和小端执行(因为一些CPU也会这样做)作为对未来CUDA平台大端的对冲。 我的猜测是答案必须是“小端”或“两者”。
所有受支持的CUDA平台都使用little-endian CPU,而cudaMemcpy()可以在不知道数据格式的情况下将数据结构复制到设备,因此我认为GPU也是小端的。 GPU可能支持大端和小端执行(因为一些CPU也会这样做)作为对未来CUDA平台大端的对冲。
我的猜测是答案必须是“小端”或“两者”。
答案 1 :(得分:3)
每个the Hardware Implementation section of the CUDA guide,小端。