如何通过在GAN架构中提供编码状态表示来训练生成对抗逆强化学习(GAIL)?

时间:2018-05-14 02:00:51

标签: deep-learning reinforcement-learning

在GAIL中,我们需要训练一个GAN。在训练GAN时,我们将专家的[State,Action]对和Agent的预测[State,Action]对输入Discriminator。假设我的状态表示是图像帧的集合。所以我需要输入从公共深度神经网络(CNN)生成的状态表示的编码。我还想在培训过程中对此进行微调。我能做到吗?

1 个答案:

答案 0 :(得分:-1)

我认为一种方法是将其编码为紧凑的连续表示,例如高斯分布。看看Variational Auto-Encoder。它对先前的分布进行编码。