卷积的尺寸?

时间:2019-11-30 12:33:18

标签: tensorflow machine-learning conv-neural-network onnx

我对如何计算该卷积及其输出尺寸有一些疑问。我熟悉使用nxm内核进行简单的卷积,使用步幅,膨胀或填充,这不是问题,但是这个尺寸对我来说似乎很奇怪。由于我使用的模型是众所周知的onnx-mnist,因此我认为它是正确的。

所以,我的意思是:

  • 如果输入的尺寸为1x1x28x28,那么输出的尺寸为1x8x28x28?
  • W表示内核。怎么可能是8x1x5x5?据我所知,第一个维度是批处理大小,但是在这里我只是用1个输入进行推断。这有道理吗?
  • 我正在从头开始实现此卷积运算符,到目前为止,它适用于1x1x28x28和1x1x5x5的内核,但是额外的尺寸对我来说没有意义。

发现附加了我正在尝试做的卷积,希望不是太| id | name | price | site_id | agency | | --- | ---- | ----- | ------- | ------- | | 1 | NAME | PRICE | 1 | AGENCY1 | | 3 | NAME | PRICE | 1 | AGENCY2 | | 5 | NAME | PRICE | 2 | AGENCY1 | 特定。

model

enter image description here

1 个答案:

答案 0 :(得分:2)

我看不到您使用的代码,但我猜8是内核数量。这意味着您在输入上将8个不同的内核以5x5的大小应用于批处理大小为1的批处理中。这就是在输出中获得1x8x28x28的方式,其中8表示激活映射的数量(每个内核一个)。

您的内核尺寸(8x1x5x5)的数字说明:

  • 8:不同过滤器/内核的数量(将是每张图像的输出图的数量)
  • 1::输入通道数。如果您输入的图像是RGB而不是灰度,则将是3而不是1。
  • 5:第一空间维度
  • 5:第二空间维度