应用错误收集

使用神经网络在线估算Q-Table

时间：2013-10-28 12:44:18

标签： machine-learning neural-network q-learning

当我在强化学习中使用Q-Table进行保存状态动作时，某些状态从未（或很少）发生，状态动作值保持为零直到最大迭代，因此我决定使用神经网络在线估计Q-Table而不是使用Q-Table。

哪种类型的神经网络可以更准确地估计这类问题，这个解决方案对我有帮助吗？

1 个答案:

答案 0 :(得分：0)

我使用Localy加权回归（LWR）作为函数逼近并简单地用这个函数替换表