标签: python deep-learning reinforcement-learning openai-gym keras-rl
我正在尝试使用action_space类型Gym.spaces.Box(4)训练DQNAgent。 但是在fit函数中,返回的动作始终为o或1。 这会导致我的环境中的步骤func失败。
我该如何使用它?