标签: deep-learning reinforcement-learning
考虑我有一个动态定价问题,我正在使用深度强化学习来解决该问题。现在,我的状态空间应视为容量,产品和客户。考虑到这三个因素,如何配置状态空间。