特工与keras-rl同行

时间:2019-08-09 17:50:41

标签: machine-learning model reinforcement-learning keras-rl

我有可用OpenAI Gym和Keras-rl训练算法的数据集。 训练完模型后,我想用在线数据对其进行测试。 因此,我不会使用.test方法,但希望循环并从传感器获取数据,并从模型中获取相应的操作。

在稳定基准中,可以像这样简单:

# After training, watch our agent walk
obs = env.reset()
for i in range(1000):
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()

0 个答案:

没有答案