应用错误收集

应用马尔可夫决策过程时如何获得转移概率？

时间：2019-11-29 20:04:46

标签： reinforcement-learning markov-decision-process

我不知道是否可以在实际问题中使用MDP，因为我不知道转换概率。我可以进入各州。

0 个答案:

没有答案