标签: artificial-intelligence reinforcement-learning mdp
我知道Dec-POMDP(Decentralized-POMDP)在有限的时间步内是NEXP完整的,但是我想知道I-POMDP是否也是NEXP完整的!如果不是,那么I-POMDP的复杂性是什么?我对此进行了一些研究,但不幸的是无法获得正确的答案。预先感谢。