你好我正在尝试学习ML。我正在使用TF DQN代理程序的例子进行分布式数据收集。
以下是原始示例的链接:https://github.com/tensorflow/agents/blob/master/docs/tutorials/1_dqn_tutorial.ipynb
这是我的代码的链接:
我怀疑问题出在大查询部分,因为我能够训练Google驱动器中存储的数据和云存储桶中存储的策略。但是,我无法确定大型查询的问题所在。
我的经纪人没有从培训中学到任何东西。接受20项政策培训后,评估所得的平均回报应为200左右,而我的整个过程中约为9。
我将很感谢您提供的任何帮助或见解,以了解为什么培训不正确 让我回到正轨。谢谢。