应用错误收集

使用一个内核跨多个卡编程多GPU应用程序/

时间：2012-02-08 19:04:06

标签： cuda gpu

我对使用CUDA编程多GPU应用感兴趣。

据我所知，可以使用多个GPU来执行并行执行2个或更多个内核。每个内核的数据都驻留在它正在执行的GPU上。

但是，如果我希望我的数据和内核操作跨越多张卡怎么办？如何做到这一点？

CUDA SDK中的simpleMultiGPU示例不是我想要的，因为它基本上在多个GPU上启动相同的内核。没有GPU间通信，这是我感兴趣的。

1 个答案:

答案 0 :(得分：2)

听起来您对统一虚拟寻址（UVA）和P2P通信感兴趣。咨询http://developer.download.nvidia.com/CUDA/training/cuda_webinars_GPUDirect_uva.pdf。你不应该在不同的CUDA块之间进行通信，但我提到的技术至少应该允许你读取数据并在多个GPU上写入数据，以更灵活的方式访问数据。

使用一个内核跨多个卡编程多GPU应用程序/
多GPU分析（多个CPU，MPI / CUDA混合）
我是否认为现代消费类显卡使用完全相同的GPU结构进行实际图形渲染和裸露计算？
使用微捷码编写代码有什么好的指导或参考吗？
将多个功能合并为一个
为一个独有的OpenCL主机程序保留GPU
多GPU编程如何与Vulkan一起使用？
cuDNN库是否适用于所有nvidia图形卡？
使用多个GPU训练一个模型
在Win10下使用几张AMD RX580卡进行FFMPEG H.264编码

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？