我有可用OpenAI Gym和Keras-rl训练算法的数据集。 训练完模型后,我想用在线数据对其进行测试。 因此,我不会使用.test方法,但希望循环并从传感器获取数据,并从模型中获取相应的操作。
在稳定基准中,可以像这样简单:
# After training, watch our agent walk
obs = env.reset()
for i in range(1000):
action, _states = model.predict(obs)
obs, rewards, dones, info = env.step(action)
env.render()