让深度学习过程在AWS上运行并稍后重新连接

时间:2018-03-21 11:10:31

标签: amazon-web-services deep-learning

我一直在深入学习可以在1小时内运行的简单数据集。但是,当我开始处理更大的项目时,我想在AWS上运行它们,但仍有一些需要很长时间才能运行(如果不是几天,则需要几个小时)。理想情况下,我希望能够让它们继续运行,关闭我的笔记本电脑并在以后再回来检查它们。

我的问题基本上是:

1,一旦我将ssh加入我的实例并设置Python脚本运行,我需要输入任何内容来告诉它我将离开吗?

2,我可以直接退出终端并关闭笔记本电脑,还是会中断此过程?

3,当我稍后回来并ssh回到终端时,我需要输入什么来重新连接已经运行的进程?

4,我怎样才能检查它的进展程度/剩下的距离(我的Python脚本输出的纪元/批次数)

谢谢!

1 个答案:

答案 0 :(得分:2)

您可以在一个屏幕上运行该过程,这样您就可以在不中断过程的情况下断开连接并重新连接。

  1. SSH到实例
  2. 输入'screen'
  3. 运行脚本
  4. Ctrl + a Ctrl + d分离
  5. 您现在可以断开连接。

    输入'screen -r'

    重新连接到屏幕

    您可以拥有多个屏幕,只需使用PID

    即可连接到此屏幕

    有关屏幕Screen User's Manual

    的更多信息