标签: deep-learning gradient-descent reinforcement-learning deeplearning4j
我正在尝试使用deep deterministic policy gradient algorithm库在Java中实现DeepLearning4j,但我在有效实施策略渐变时遇到了一些麻烦。
在许多tensorflow实现中,使用以下简单命令
tf.gradients(output, network_params, -action_gradient)
使用DeepLearning4J库可以轻松完成吗?
答案 0 :(得分:0)
实施政策梯度,如外部错误例子所示,对我来说效果很好
https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/misc/externalerrors/MultiLayerNetworkExternalErrors.java