应用错误收集

深度强化学习中的状态值

时间：2020-05-22 15:36:21

标签： python deep-learning reinforcement-learning unsupervised-learning

我正在学习深度强化学习。我对状态值有些困惑。是否可以在状态中使用动态值，还是必须使用离散值并为我们拥有的每个值创建一个状态？

0 个答案:

没有答案