keras强化学习-具有多个输出的动作

时间:2020-04-22 14:27:39

标签: python tensorflow keras reinforcement-learning

我正在尝试使用自定义环境在keras-rl中设置DQNAgent或DDPGAgent。 我需要模型给出48个数字(基本上是一个数组)的输出(动作)。我试图将输出定义为如下的spaces.box对象:

self.action_space = spaces.Box(low=self.boundsLow, high=self.boundsHigh, shape=(48, ), dtype=np.int32)

我还尝试了多离散动作空间。

错误是在step()函数中,我仅从神经网络接收了I值(数字): ``` def步骤(自我,行动​​): 打印(动作)


The neural network:
    ```
model.add(Flatten(input_shape=(1,) + env.observation_space.shape))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(48))
model.add(Activation('linear'))
print(model.summary())

我怎么可能只收到一个电话号码? 有人可以帮忙吗?

谢谢!

0 个答案:

没有答案