我对Memory Networks和Movie Dialog QA感兴趣。最近facebook宣布了名为ParlAI的AI培训框架,该框架支持许多模型和数据集。虽然我在ParlAI上尝试了以下命令,但培训在loss.backward()
memnn.py
开始停止。我等了将近一天,但是loss.backward()
没有完成。我通过打印调试和[Using Cuda]
打印来检查这一点。实际上我的GPU工作是因为它使用了一些内存。我通过nvidia-smi -l 1
检查了这个。
python examples/train_model.py -m memnn -t "#moviedd-qa" -bs 32 --gpu 0 -e 10
然后,我切换到简单的任务,它完成了几分钟。
python examples/train_model.py -m memnn -t "babi:task1k:1" -bs 32 --gpu 0 -e 10
我认为#moviedd-qa
与babi任务相比更复杂。但是在我的环境中训练这个模型通常需要多长时间?有没有人试图通过ParlAI训练这个模型?我担心这不是ParlAI的错误。你能建议我继续我的工作吗?
我的环境