火炬的损失。后退()挂在ParlAI上

时间:2017-09-20 19:57:12

标签: python machine-learning torch backpropagation pytorch

我对Memory NetworksMovie Dialog QA感兴趣。最近facebook宣布了名为ParlAI的AI培训框架,该框架支持许多模型和数据集。虽然我在ParlAI上尝试了以下命令,但培训在loss.backward() memnn.py开始停止。我等了将近一天,但是loss.backward()没有完成。我通过打印调试和[Using Cuda]打印来检查这一点。实际上我的GPU工作是因为它使用了一些内存。我通过nvidia-smi -l 1检查了这个。

python examples/train_model.py -m memnn -t "#moviedd-qa" -bs 32 --gpu 0 -e 10

然后,我切换到简单的任务,它完成了几分钟。

python examples/train_model.py -m memnn -t "babi:task1k:1" -bs 32 --gpu 0 -e 10

我认为#moviedd-qababi任务相比更复杂。但是在我的环境中训练这个模型通常需要多长时间?有没有人试图通过ParlAI训练这个模型?我担心这不是ParlAI的错误。你能建议我继续我的工作吗?

我的环境

  • Ubunt 16.04.03 LTS,64位
  • python 3.6.1(Anaconda 4.4.0(64位))
  • GPU:GTX 1080 ti
  • CPU:Intel(R)Core(TM)i7-7700K CPU @ 4.20GHz
  • 火炬。版本:'0.2.0_3'

我也是asking developers at ParlAI at their github,但没有回复。

0 个答案:

没有答案