应用错误收集

流水线应用程序可能在GPU上使用3个缓冲区。一个缓冲区用于保存当前正在传输到 GPU（来自主机）的数据，一个缓冲区用于保存当前由处理 GPU的数据，以及一个缓冲区保存当前从传输到主机的数据（结果）。

这意味着您的应用程序处理可以分解为＆＃34; chunk＆＃34;。对于许多处理大型数据集的应用程序来说都是如此。

CUDA streams使开发人员能够编写允许这3个操作（转移，处理，转移）同时运行的代码。

在上面的场景中，没有特定的数字来定义缓冲区的大小。当然，一个简单的实现将创建3个缓冲区，每个缓冲区小于GPU上总内存的1/3，留下一些内存用于开销和其他可能需要存在于GPU内存中的数据。因此，如果你的GPU有5GB，你可以使用三个1GB缓冲区运行。但是没有像deviceQuery这样的工具会告诉你这个;它不是设备的属性。

您可能需要仔细阅读上述链接的编程指南部分，并查看CUDA simple streams示例代码。

GPU可以获取的最大数据量？

1 个答案: