我正在尝试在 Spacy Transformer 模型之上训练自定义 NER 模型。 为了加快训练速度,我在带有高内存服务器的 Google Colab Pro 上的带有 cuda 的 GPU 上运行它。
第一次迭代后,我得到一个错误:
<块引用>运行时错误:CUDA 内存不足。尝试分配 480.00 MiB(GPU 0; 11.17 GiB 总容量; 9.32 GiB 已经分配; 193.31 MiB 免费; PyTorch 总共预留了 10.32 GiB)
对于上述错误,我也尝试清空缓存。但我仍然收到此错误。似乎没有释放足够的空间。
import torch
torch.cuda.empty_cache()
此外,我还尝试将批量大小减少到 2。仍然出现相同的错误。