我是初学者,通过婴儿步骤学习深度学习。我有关于设计网的问题。我在论文中看到,有不同输入/输出的层,我不知道在实现之前如何计算/设计。 例如,在这个paper中,原理图层输出旁边有一些数字(见下图)。如何为具有特定图像大小的网络指定这些过滤器大小和其他参数作为输入。
他们已经提到,对于256x256
输入图像,
网络的总子采样因子为4
,导致
a 64x64xL array
,其中L是类标签的数量。如何获得此64x64
尺寸?
我如何学习设计网络并计算图层的输入/输出?
感谢您的帮助
答案 0 :(得分:2)
如果您使用stride=2
进行两次池化,则意味着您将图像大小减少2倍,从而导致图像大小总共减少x4(子采样)。因此,如果您从尺寸为256:256/4 = 64的图像开始。
如何选择内核大小,每层输出数量,步幅和其他设计参数?实际上没有单一的答案,基本上很多论文/作品都采用不同的设置来处理相同的任务。 AFAIK没有明确的指导方针或明显的参数选择,适合任何特定任务 话虽这么说,你可以找到this work调查一些新兴的深网设计模式。