应用错误收集

使用DeepLearning4J的DDPG政策梯度

时间：2017-05-04 23:31:28

标签： deep-learning gradient-descent reinforcement-learning deeplearning4j

我正在尝试使用deep deterministic policy gradient algorithm库在Java中实现DeepLearning4j，但我在有效实施策略渐变时遇到了一些麻烦。

在许多tensorflow实现中，使用以下简单命令

计算策略梯度

tf.gradients(output, network_params, -action_gradient)

使用DeepLearning4J库可以轻松完成吗？

1 个答案:

答案 0 :(得分：0)

实施政策梯度，如外部错误例子所示，对我来说效果很好

https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/misc/externalerrors/MultiLayerNetworkExternalErrors.java