pytorch - 尝试使用 spacy 的 Transformer 模型训练模型时 cuda 内存不足

我正在尝试在 Spacy Transformer 模型之上训练自定义 NER 模型。为了加快训练速度，我在带有高内存服务器的 Google Colab Pro 上的带有 cuda 的 GPU 上运行它。

第一次迭代后，我得到一个错误：

<块引用>

运行时错误：CUDA 内存不足。尝试分配 480.00 MiB（GPU 0； 11.17 GiB 总容量； 9.32 GiB 已经分配； 193.31 MiB 免费； PyTorch 总共预留了 10.32 GiB）

对于上述错误，我也尝试清空缓存。但我仍然收到此错误。似乎没有释放足够的空间。

import torch
torch.cuda.empty_cache()

此外，我还尝试将批量大小减少到 2。仍然出现相同的错误。