我正在努力优化CUDA程序的性能。
我使用torch.backends.cudnn.benchmark
来优化性能,并使用torch.cuda.synchronize()
来同步pytorch中的CUDA应用程序。
为了在tensorflow中完成相同的工作,我花了很多时间搜索是否在tensorflow中包含类似的代码,但是我什么都找不到。
我想知道是否有任何等效的代码
torch.cuda.synchronize()
和torch.backends.cudnn.benchmark
存在于张量流中。