标签: python deep-learning reinforcement-learning unsupervised-learning
我正在学习深度强化学习。我对状态值有些困惑。是否可以在状态中使用动态值,还是必须使用离散值并为我们拥有的每个值创建一个状态?