通常情况下,我们会设置输入图片' height',' width'' channel'。
在'频道'中,我们为灰度图片设置1,为RGB图片设置3。
我的问题是,使用此频道的图片是否相同?如上所述。
或者我可以将一系列图像设置为频道?
(例如,我在一个时刻有10个图像在空间中离散,所以我将通道10设置为一个输入)
会有任何问题吗?这是正确的方法吗?
或者我应该为这10张图片设置10个输入?
感谢您的回答!
答案 0 :(得分:0)
不,它不会相同,因为输入层的通道数决定了卷积滤波器的形状,因此参数的数量及其应用方式。
比较这两个卷积网络:
[32x32x3]
输入形状,batch_size=5
,5x5
感知字段,然后转化层中的每个神经元将具有输入音量中[5x5x3]
区域的权重,总计 5*5*3 = 75
权重(以及+1偏见参数)。[32x32x15]
输入形状,batch_size=1
,相同5x5
接受字段,然后每个神经元都会对[5x5x15]
区域产生权重,总计 {{ 1}} 权重(以及相同的+1偏见参数)。在这两种情况下,两个转换层都会看到15个RGB图像,但第二个网络将使用5倍以上的参数来学习相同的数据,而第一个网络将使用相同的参数来处理不同的图像。另请注意,第二个网络将为每个第一个图像,每个第二个图像等提供专用参数。
显然,第一种方法更好,不仅因为它节省了资源,而且对批量训练图像的顺序也不变。