标签: python tensorflow tensorflow2.0 reinforcement-learning
我正在尝试将TF 1.x和TFlearn中的可用代码重做为TF 2.x和Keras
这是TF 1.x中的代码(使用TFlearn)
Z.x
我在TF 2.x和Keras中重写了这一点:
BCD
这两个代码实现相同吗?
PS:这是为强化学习算法DDPG中的Critic Network编写的类,其中第一个代码由pemami4911