标签: cuda scheduling
在CUDA流上,我们可以入队:
但是没有API调用出列任何这些操作。对于某些或所有这些操作,有没有办法达到同样的效果?
注意:不排除涉及破坏流的建议。
答案 0 :(得分:0)
对于发布,我们可以将内核和/或回调写入:
在这种情况下,可以通过设置其标志来中止它们。有点浪费,但不是很糟糕。
我不确定其他一切。