Openai宇宙 - 初学者 - 代理人没有训练

时间:2017-04-14 00:19:52

标签: openai-gym

我一直在尝试运行Openai的universe-starter-agent示例here,但是,在AWS上使用m4.16xlarge实例,有32名工作人员,代理人的培训结果在0.6小时后没有改善(超过30分钟)虽然在GitHub页面上声明“代理能够在10分钟内解决相同的环境”。

通过TensorBoard监控进度。请注意GitHub中给出的示例是针对16名工人的情况,并且它在30分钟内收敛到21的情节奖励,而对于这种情况,工人数量增加一倍且培训时间相同,奖励不会没有改善。我也看了看日志,似乎没有编译错误。我用来运行脚本的命令是:

python train.py --num-workers 32 --env-id PongDeterministic-v3 --log-dir /tmp/pong

Screenshot of TensorBoard

我发现有点可疑的唯一一件事就是在运行脚本时,显示了以下错误,但没有中止运行。错误内容为:“无法连接到服务器”

Error appearing at the bottom

是否有其他人运行入门代理,和/或遇到类似问题?如果是这样,你是如何解决的?

谢谢!

1 个答案:

答案 0 :(得分:0)

问题解决了 - 将张量流从1.0.0降级到0.11.0并按预期进行了培训!