应用错误收集

训练后如何保存RL模型

时间：2020-03-31 01:53:11

标签： reinforcement-learning

我是这个论坛的新手。我查看了这个简单的强化学习sarsa代码This is code link

我无法看到的是如何存储它的模型，就像我们在深度学习中曾经在CNN中存储权重一样，因此我们可以加载模型并对其进行工作，而无需每次对其进行训练。这有可能实现吗？非常感谢

1 个答案:

答案 0 :(得分：0)

您好，欢迎@BetaLearner。在链接的示例中，Q函数存储为表格，而不是使用神经网络或其他类型的函数逼近器。因此，您只需保存表（实际上存储为defaultdict）并在以后加载它，而无需再次进行训练。