应用马尔可夫决策过程时如何获得转移概率?

时间:2019-11-29 20:04:46

标签: reinforcement-learning markov-decision-process

我不知道是否可以在实际问题中使用MDP,因为我不知道转换概率。我可以进入各州。

0 个答案:

没有答案