我正在使用没有GPUDirect支持的GPU群集。从此briefing开始,在跨节点传输GPU数据时完成以下操作:
现在,当我使用MPI在Infiniband上传输sysmem1时,我不确定第二步是否是隐式步骤。假设这一点,我目前的编程模型是这样的:
我的上述假设是否正确,我的编程模型是否会在不引起通信问题的情况下工作?
答案 0 :(得分:3)
是的,您可以单独使用CUDA和MPI(即没有GPUDirect),就像您描述的那样。
您可能对this presentation感兴趣,它解释了CUDA感知的MPI,并在非cuda MPI和CUDA-MPI的幻灯片11上并排示例