标签: python keras reinforcement-learning keras-rl
我正在建立Agent中的keras-rl,并且将LinearAnnealedPolicy与EpsGreedyQPolicy一起使用。执行详细信息将输出每个间隔的平均epsilon,但是我想稍后绘制针对epsilon的奖励,并且fit方法返回的训练历史记录没有epsilons的数组。有Callback方法可以做到吗?
Agent
keras-rl
LinearAnnealedPolicy
EpsGreedyQPolicy
Callback