标签: cuda gpu nvidia
document指出:
一个CUDA上下文中的内核不能与另一个CUDA上下文中的内核同时执行。
但是,当我对一个多进程程序进行性能分析时,内核以及Memcpys都是并行运行的(尽管它们来自不同的上下文),这很容易实现:
我在CUDA9.0上使用TITAN Xp,而没有使用Multi-Process Service。
CUDA9.0
TITAN Xp
Multi-Process Service