应用错误收集

cuda对等拷贝没有API调用，允许您在两端指定流。你的问题的简单答案是否定的。

Streams是一种组织活动的方式。 cudaMemcpyPeerAsync调用将显示在分配给它的流（和设备）中。这是您使用API的控制级别。

由于流指示（即控制，调节）行为，能够将cuda任务分配给单独的流（在多个设备上，在这种情况下）是一个未在CUDA中公开的控制级别。设备（和流）旨在异步操作，并要求特定的cuda任务满足两个独立流的要求（在这种情况下在两个单独的设备上）会引入一种不合适的同步类型，并且可能导致各种活动摊位，甚至可能是僵局。

此处的描述和cudaMemcpyPeerAsync的行为都不能阻止您在各个方向上重叠复制操作。实际上，在我看来，将cuda任务分配给多个流将使得更难以实现灵活的重叠。

如果您难以实现特定重叠，您应该描述问题（即，提供简单的再现器完整的可编译SSCCE.org代码），并显示视觉分析器显示的当前重叠场景，并描述所需的重叠场景

如何在cudaMemcpyPeerAsync（）中定义目标设备流？

1 个答案: