我知道将完全连接层实现为卷积层会减少参数,但会提高计算速度。如果是,那为什么人们仍然使用全连接层?
答案 0 :(得分:0)
卷积层用于 低级推理 ,例如特征提取。在此级别上,使用完全连接的层将浪费资源,因为必须计算更多的参数。如果您的图像尺寸为32x32x3,则完全连接的图层将需要为第一层计算 32 * 32 * 3 = 3072 权重。低级推理不需要这些许多参数。特征往往在图像中具有空间局部性,并且局部连通性足以进行特征提取。如果您使用卷积层,大小为3x3的12个滤镜,则只需计算 12 * 3 * 3 = 108 权重。
完全连接的层用于 高级推理 。这些是网络中确定卷积网络最终输出的层。随着推理变得越来越复杂,本地连接不再足够,这就是为什么在网络的后期使用完全连接的层的原因。
请阅读this,以获取更详细和直观的说明