我最近正在研究GAN模型,并认为这对于我的系统将非常有用,在该系统中,我将预测给定的图像是否是汽车。我理解“鉴别器”从“生成器”获得输入的部分。生成器从随机向量生成图像,然后将其传递到鉴别器以进行真实性检查。但是,生成器使用的向量到底是什么?它是在转换为像素的图像中,然后作为像素向量传递吗?
任何人都可以给我解释一下
或者,我还有什么其他方法可以用来构建可以将图像分类为汽车的系统
预先感谢
答案 0 :(得分:0)
生成器的输入是完全随机值的z维向量。对于DCGAN,输入来自高斯分布源。 GANs的理论基于这样的事实,即这些随机值被学习为被网络扭曲,从而使判别器/评论家被生成器生成的图像所欺骗。生成器和鉴别器都是彼此的对手,使每个时代都变得更好,因此被称为对抗网络。
要将图像分类为汽车而非汽车,您实际上可以使用简单的ConvNet通过在多个汽车图像和“非汽车”图像上进行训练来相当轻松,准确地解决此问题。已经有相当复杂的对象检测网络经过Imagenet数据培训,因此您不妨先参考这些网络的体系结构。
希望我的回答对您有所帮助。 :)