OpenAI Gym RL算法的“学习”方法是否会重置模型?

时间:2020-01-14 15:13:45

标签: python openai-gym

如果我第二次调用“学习”,会先重置模型,还是进一步调用“学习”来改善模型?

例如,将

Microsoft.Xaml.Behaviors.TriggerAction<T>

import gym
from stable_baselines.common.policies import MlpPolicy
from stable_baselines.common import make_vec_env
from stable_baselines import A2C
env = make_vec_env('CartPole-v1', n_envs=4)
model = A2C(MlpPolicy, env, verbose=1)
model.learn(total_timesteps=10000) # NOTE the number

产生一些相似的模型,对涉及的随机性取模吗?

0 个答案:

没有答案