我正在AWS EC2实例上的特定数据集上运行转移学习算法(ResNet-50)。更具体地说,我使用标准的Amazon Community AMI在p3.8xlarge GPU计算实例上进行深度学习。
当我进入实例时,我会激活深度学习conda环境。从那里,我启动了jupyter笔记本,以在python 3内核中运行代码。
当我第一次开始运行代码时,它可以正常运行。下面是CPU利用率%:
在代码中的某些点,与笔记本电脑的连接失败。这是我从终端获得的唯一信息:
packet_write_wait:连接到X.X.X.X IP地址端口22:管道损坏
我该如何解决?