任何人都可以向我解释一下这一基本问题吗:如何使用1x1转换映射将192x28x28的输入图像简化为16x28x28的特征图。我的问题是要了解当192变为16时到底会发生什么?
我知道((I-2P-F)/ S)+1,但是在减小深度的过程中会发生什么。
答案 0 :(得分:1)
1x1卷积将整个192 * 28 * 28输入图像(可以将其读取为final int maxLengthOfSublist = list1.stream().mapToInt(List::size).max().orElse(0);
final List<List<Integer>> list2 = IntStream.range(0, maxLengthOfSublist)
.mapToObj(idx -> list1.stream()
.filter(sublist -> idx < sublist.size())
.map(sublist -> sublist.get(idx))
.collect(Collectors.toList())
)
.collect(Collectors.toList());
个像素图像的192个特征图)压缩为单个1 * 28 * 28图像。到目前为止,它在保留原始图像的高度和宽度的同时,将“特征图轴”的深度减小为1。
但是,...为什么要得到16?在卷积层中,您可以具有不同的内核。基本上每个内核都是大小相同的独立过滤器。在您的情况下,默认情况下,看起来您的1x1转换层具有16个内核,因此您将获得16个28 * 28图像(每个内核一个)。