Question

我对Memory Networks和Movie Dialog QA感兴趣。最近facebook宣布了名为ParlAI的AI培训框架，该框架支持许多模型和数据集。虽然我在ParlAI上尝试了以下命令，但培训在loss.backward() memnn.py开始停止。我等了将近一天，但是loss.backward()没有完成。我通过打印调试和[Using Cuda]打印来检查这一点。实际上我的GPU工作是因为它使用了一些内存。我通过nvidia-smi -l 1检查了这个。

python examples/train_model.py -m memnn -t "#moviedd-qa" -bs 32 --gpu 0 -e 10

然后，我切换到简单的任务，它完成了几分钟。

python examples/train_model.py -m memnn -t "babi:task1k:1" -bs 32 --gpu 0 -e 10

我认为#moviedd-qa与babi任务相比更复杂。但是在我的环境中训练这个模型通常需要多长时间？有没有人试图通过ParlAI训练这个模型？我担心这不是ParlAI的错误。你能建议我继续我的工作吗？

我的环境

Ubunt 16.04.03 LTS，64位
python 3.6.1（Anaconda 4.4.0（64位））
GPU：GTX 1080 ti
CPU：Intel（R）Core（TM）i7-7700K CPU @ 4.20GHz
火炬。版本：'0.2.0_3'

我也是asking developers at ParlAI at their github，但没有回复。

火炬的损失。后退（）挂在ParlAI上

0 个答案: