python - TF代理训练不正确，具有大查询的分布式数据收集

你好我正在尝试学习ML。我正在使用TF DQN代理程序的例子进行分布式数据收集。

以下是原始示例的链接：https://github.com/tensorflow/agents/blob/master/docs/tutorials/1_dqn_tutorial.ipynb

这是我的代码的链接：

文件1：re F1 BigQuery w Bucket: Collect Data.ipynb

文件2：re F2 BigQuery w Bucket: Train.ipynb

我怀疑问题出在大查询部分，因为我能够训练Google驱动器中存储的数据和云存储桶中存储的策略。但是，我无法确定大型查询的问题所在。

我的经纪人没有从培训中学到任何东西。接受20项政策培训后，评估所得的平均回报应为200左右，而我的整个过程中约为9。

我将很感谢您提供的任何帮助或见解，以了解为什么培训不正确让我回到正轨。谢谢。

TF代理训练不正确，具有大查询的分布式数据收集

0 个答案: