在GAN框架中,发生器将违反未在图像中明确表示的实际分布的硬约束的情况并不罕见,例如,狗很少有一个头或四条腿。
鉴于没有头部或腿部计数神经元,并且对使用领域知识挖掘这些规范并将其用作鉴别器的输入不感兴趣,有哪些方法可以挖掘和执行这些规范。 GAN或约束优化问题。
在我自己的情况下,数据由钢琴卷组成,即一个轴代表时间T,另一个代表音符N. 规范的一些示例可以是:A)对于T中的每个t,将只有一个正值N,即每个时间步骤一个音符B)正值N只有在其正值的直接和间接邻居的计数中才存在。 Note轴等于或大于2.
e.g。
Invalid
10110110
11001101
Valid
00000000
11101111
非常欢迎建议或建议! 控制低级图像特征的一个示例。 https://arxiv.org/pdf/1611.07865.pdf