所提到的论文的瓶颈层由一个扩展,一个深度卷积和一个投影层组成,如下图所示:
因此,假设我有一个56x56x64的输入且扩展因子为t = 2,我首先应用一个1x1卷积,其内核为1x1x64,该内核应输出128个通道,这意味着我在第一个卷积中的权重为128x1x1x64。第二层是深度卷积,在这128个通道中的每个通道上具有3x3内核,从而产生128x3x3权重。与第一层相似,投影层是一个1x1卷积,其内核为1x1x128,并输出64个通道,从而产生了64x1x1x128的权重。
但是,当我尝试复制砝码的数量时,他们在论文中指出,我的结果太大了。有人可以告诉我我在哪里犯错吗?
有关更多信息和上下文,请参阅论文https://arxiv.org/pdf/1801.04381.pdf。谢谢!