应用错误收集

如何通过在GAN架构中提供编码状态表示来训练生成对抗逆强化学习（GAIL）？

时间：2018-05-14 02:00:51

标签： deep-learning reinforcement-learning

在GAIL中，我们需要训练一个GAN。在训练GAN时，我们将专家的[State，Action]对和Agent的预测[State，Action]对输入Discriminator。假设我的状态表示是图像帧的集合。所以我需要输入从公共深度神经网络（CNN）生成的状态表示的编码。我还想在培训过程中对此进行微调。我能做到吗？

1 个答案:

答案 0 :(得分：-1)

我认为一种方法是将其编码为紧凑的连续表示，例如高斯分布。看看Variational Auto-Encoder。它对先前的分布进行编码。

Keras列车部分模型问题（关于GAN模型）
如何在Tensorflow中异步更新GAN Generator和Discriminator？
如何通过在GAN架构中提供编码状态表示来训练生成对抗逆强化学习（GAIL）？
我是否必须每批重新编译Gan，以防止歧视者学习？
如何为GAN制作2D环和网格数据集？
将PNG或JPEG图像转换为GAN算法接受的格式
深度学习+音乐，使用GAN生成音乐，如何播放Midi图像中的歌曲
有没有办法用两组不同的图像训练鉴别器（GAN）？
GAN中信号幅度的确切含义是什么
如何从GAN训练发电机？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？