我正在研究 SwishNet ,这是一种用于语音,音乐和噪声分类和分割的快速CNN。
在那个paper中,他们使用了 Strided Convolution 和 Residual Net 。经过stride=2 conv layer
之后,其输出长度将为输入长度的一半。
我的问题是,即使数组尺寸不匹配,如何将输出与输入(残余连接)合并?
G.A 只是门控激活功能,因此它不会影响输出尺寸!
答案 0 :(得分:0)
如果您查看《 Gate Activation》( G )借用的参考文件Conditional Image Generation with PixelCNN Decoders,您会注意到它使用以下公式:
尽管<?php
if (get_sub_field('rls_status') == "ONLINE") {
echo '<div class="online">Status: ONLINE'</div>;
}
elseif (get_sub_field('rls_status') == "OFFLINE") {
echo '<div class="offline">Status: OFFLINE';</div>
}?>
将尺寸减小到输入尺寸的一半,但是具有适当stride=2
尺寸的 GA 层会产生与输入尺寸相同的图像,这意味着不会发生不匹配的尺寸。