Question

我没有在网上找到对此问题的明确答案（很抱歉，如果存在）。我想逐步了解两个函数（ SeparableConv2D 和 Conv2D ）之间的区别，例如输入（3,3， 3）（作为RGB图像）。

基于Keras-Tensorflow运行此脚本：

import numpy as np
from keras.layers import Conv2D, SeparableConv2D
from keras.models import Model
from keras.layers import Input

red   = np.array([1]*9).reshape((3,3))
green = np.array([100]*9).reshape((3,3))
blue  = np.array([10000]*9).reshape((3,3))

img = np.stack([red, green, blue], axis=-1)
img = np.expand_dims(img, axis=0)

inputs = Input((3,3,3))
conv1 = SeparableConv2D(filters=1, 
              strides=1, 
              padding='valid', 
              activation='relu',
              kernel_size=2, 
              depth_multiplier=1,
              depthwise_initializer='ones',
              pointwise_initializer='ones',
              bias_initializer='zeros')(inputs)

conv2 = Conv2D(filters=1, 
              strides=1, 
              padding='valid', 
              activation='relu',
              kernel_size=2, 
              kernel_initializer='ones', 
              bias_initializer='zeros')(inputs)

model1 = Model(inputs,conv1)
model2 = Model(inputs,conv2)
print("Model 1 prediction: ")
print(model1.predict(img))
print("Model 2 prediction: ")
print(model2.predict(img))
print("Model 1 summary: ")
model1.summary()
print("Model 2 summary: ")
model2.summary()

我有以下输出：

Model 1 prediction:
 [[[[40404.]
   [40404.]]
  [[40404.]
   [40404.]]]]
Model 2 prediction: 
[[[[40404.]
   [40404.]]
  [[40404.]
   [40404.]]]]
Model 1 summary: 
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
input_1 (InputLayer)         (None, 3, 3, 3)           0         
_________________________________________________________________
separable_conv2d_1 (Separabl (None, 2, 2, 1)           16        
=================================================================
Total params: 16
Trainable params: 16
Non-trainable params: 0
_________________________________________________________________
Model 2 summary: 
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
input_1 (InputLayer)         (None, 3, 3, 3)           0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 2, 2, 1)           13        
=================================================================
Total params: 13
Trainable params: 13
Non-trainable params: 0

由于this post，我了解Keras如何计算模型2的 Conv2D 预测，但是有人可以解释一下模型1预测的 SeperableConv2D 计算及其参数数量（16）

Answer 1

由于Keras使用Tensorflow，您可以在Tensorflow的API中检查区别。

conv2D是传统的卷积。因此，您有一个带有或不带有填充的图像，并且过滤器以给定的步幅在图像中滑动。

另一方面，SeparableConv2D是传统卷积的一种变体，被提出以更快地进行计算。它执行深度空间卷积，然后是将结果输出通道混合在一起的逐点卷积。例如，MobileNet使用此操作可以更快地计算卷积。

我可以在这里解释这两种操作，但是，post使用了我强烈建议您阅读的图像和视频，对此有很好的解释。

我希望这会有所帮助。

SeparableConv2D图层和Conv2D图层之间有什么区别？

1 个答案: