在EC2实例上具有200GB数据的AWS深度学习-Jupyter笔记本计算机连接失败

时间:2018-10-08 04:11:02

标签: amazon-ec2 deep-learning cloud conv-neural-network

我正在AWS EC2实例上的特定数据集上运行转移学习算法(ResNet-50)。更具体地说,我使用标准的Amazon Community AMI在p3.8xlarge GPU计算实例上进行深度学习。

当我进入实例时,我会激活深度学习conda环境。从那里,我启动了jupyter笔记本,以在python 3内核中运行代码。

当我第一次开始运行代码时,它可以正常运行。下面是CPU利用率%:

在代码中的某些点,与笔记本电脑的连接失败。这是我从终端获得的唯一信息:

packet_write_wait:连接到X.X.X.X IP地址端口22:管道损坏

我该如何解决?

0 个答案:

没有答案