python - keras强化学习-具有多个输出的动作

我正在尝试使用自定义环境在keras-rl中设置DQNAgent或DDPGAgent。我需要模型给出48个数字（基本上是一个数组）的输出（动作）。我试图将输出定义为如下的spaces.box对象：

self.action_space = spaces.Box(low=self.boundsLow, high=self.boundsHigh, shape=(48, ), dtype=np.int32)

我还尝试了多离散动作空间。

错误是在step（）函数中，我仅从神经网络接收了I值（数字）： ``` def步骤（自我，行动）：打印（动作）


The neural network:
    ```
model.add(Flatten(input_shape=(1,) + env.observation_space.shape))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(48))
model.add(Activation('linear'))
print(model.summary())

我怎么可能只收到一个电话号码？有人可以帮忙吗？

谢谢！

keras强化学习-具有多个输出的动作

0 个答案: