使用DeepLearning4J的DDPG政策梯度

时间:2017-05-04 23:31:28

标签: deep-learning gradient-descent reinforcement-learning deeplearning4j

我正在尝试使用deep deterministic policy gradient algorithm库在Java中实现DeepLearning4j,但我在有效实施策略渐变时遇到了一些麻烦。

在许多tensorflow实现中,使用以下简单命令

计算策略梯度
tf.gradients(output, network_params, -action_gradient)

使用DeepLearning4J库可以轻松完成吗?