标签: cuda
如果系统有两个CPU和4个显卡,并且如果每对卡连接不同的CPU,那么gpu的cuMemAllocHost命令是否从最近的CPU节点分配给该GPU?
可以从最近的pci-e路径查看固定数组(使用cudaHostRegister还是cuMemAllocHost)?
如果它不是numa意识,我是否可以信任此操作系统功能,并且在使用与开发系统相同的操作系统的任何系统上具有最低的访问延迟?
答案 0 :(得分:1)
CUDA不提供NUMA控制。
NUMA的管理对于实现CUDA代码的最高性能当然很重要,并且应遵循与CUDA编程正交的standard methods。