SSH:Torch-Lua脚本意外停止

时间:2016-04-12 14:30:12

标签: command-line ssh lua scripting

我正尝试在远程(Ubuntu 14.04)计算机上使用 SSH luajit 解释器上运行Torch-Lua脚本。它只运行两次迭代并相应地显示所有输出,但是,一旦第三次迭代完成,由于一些意想不到的原因,它似乎自行停止并且我返回到终端< / strong>远程机器。

它不会显示任何标准的OS消息,例如'luajit'进程被终止或被信号终止。我使用'top'来检查它是否在后台运行但事实并非如此。远程计算机都没有关闭,也没有失去连接,因为我通过SSH保持与远程计算机的连接。当然,脚本不应该有任何问题,因为完全相同的脚本在我的本地机器上运行直到完成。我还想提一下,我在远程计算机上也有 sudo -er权限。

我发布这个是因为我在两个不同的独立远程计算机上尝试了相同的操作,并且它的行为方式相同。有人可以通过分享这个脚本/机器可能表现出来的“神秘”方式背后的原因以及我可以尝试的可能解决方案来帮助我吗?

提前致谢。

编辑: 以下是每次运行相同脚本时在终端上收到的输出:

==> the main loop   
==> online epoch # 1 [batchSize = 128]  
 [==================== 15/15 ==================>]  Tot: 46s400ms | Step: 3s314ms
Train accuracy: 4.90 %   time: 50.33 s  
==> testing 
Test accuracy: 1.50 %= 8 time: 3.05 s====>......]  ETA: 387ms | Step: 3ms       
==> online epoch # 2 [batchSize = 128]  
 [==================== 15/15 ==================>]  Tot: 49s439ms | Step: 3s531ms
Train accuracy: 5.05 %   time: 50.44 s  
==> testing 
Test accuracy: 1.50 %= 8 time: 2.92 s====>......]  ETA: 369ms | Step: 2ms       
==> online epoch # 3 [batchSize = 128]  
 [==================== 15/15 ==================>]  Tot: 50s620ms | Step: 3s615ms
Train accuracy: 5.00 %   time: 51.38 s  
user-name@my-remote-machine:~/path/to/script$

(从输出中可以看出,该脚本本质上是一个转发网络的培训测试程序。)

1 个答案:

答案 0 :(得分:1)

经过一番思考和调试后,我发现了我的脚本问题并解决了它。

SSH和系统的配置都没有终止脚本的执行。问题与我的脚本有点不同。由于我连接的远程机器无法作为标准桌面访问(我的意思是它没有像GNOME这样的桌面环境),所以我无法做到&#39; < strong> ssh -x &#39;到机器。只需使用命令行即​​可完成与机器的所有交互。

所以,&#34; live plot &#34;在我的脚本中基本上接受了训练/测试日志,在每个纪元后由脚本主动创建,并且显示训练/测试准确性与纪元图(使用&#39; gnuplot &#39)。在我的原始脚本(在我的仅支持CPU,桌面环境的机器上运行)中,它已启用。由于我最初在远程计算机上使用相同的脚本,因此在我的情况下,相同的启用导致了这个奇怪的问题。在我禁用它之后,我能够正常运行时代和训练测试程序,正如我所预期的那样。在我的脚本中,它只是一个标志,我必须将其设置为true / false,以启用/禁用此&#34; live plot&#34;功能(类似于在this tutorial中完成的方式)。