应用错误收集

特工与keras-rl同行

时间：2019-08-09 17:50:41

标签： machine-learning model reinforcement-learning keras-rl

我有可用OpenAI Gym和Keras-rl训练算法的数据集。训练完模型后，我想用在线数据对其进行测试。因此，我不会使用.test方法，但希望循环并从传感器获取数据，并从模型中获取相应的操作。

在稳定基准中，可以像这样简单：

# After training, watch our agent walk
obs = env.reset()
for i in range(1000):
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()

0 个答案:

没有答案