我是这个论坛的新手。我查看了这个简单的强化学习sarsa代码This is code link
我无法看到的是如何存储它的模型,就像我们在深度学习中曾经在CNN中存储权重一样,因此我们可以加载模型并对其进行工作,而无需每次对其进行训练。这有可能实现吗?非常感谢
答案 0 :(得分:0)
您好,欢迎@BetaLearner。在链接的示例中,Q函数存储为表格,而不是使用神经网络或其他类型的函数逼近器。因此,您只需保存表(实际上存储为defaultdict
)并在以后加载它,而无需再次进行训练。