我在pytorch官方网站上注意到了这一点:https://pytorch.org/docs/stable/nn.html
如果满足以下条件:
1)启用了cudnn,
2)输入数据在GPU上,
3)输入数据的类型为torch.float16,
4)使用V100 GPU,并且
5)输入数据不是PackedSequence格式。
然后,可以选择持久性算法来提高性能。
有人可以解释吗?谢谢。
答案 0 :(得分:0)
这是指GPU缓存使用率的极低水平的性能优化,对此进行了更深入的解释here(注意:这不是PyTorch的材料,但我认为它在解释方面做得很好)。换句话说,如果所有子弹都满足了,PyTorch将默认使用其他算法,以期提供更高的RNN
性能。