实施convolutional neural network (CNN) in theno时遇到conv2d
运算符的两种变体:
max-pooling的实现:
我的问题是:
conv2d
的两个实现之间有什么区别? subsample
使用conv2d
参数与max_pool_2d
之后conv2d
子采样的应用有何区别?
这就是:
conv2d( ..., subsample=(2,2) )
和
a = conv2d( ..., subsample = (1,1) )
max_pool_2d( a, ds = (2,2) )
答案 0 :(得分:6)
在回答您的第一个问题时,here is the section of the Theano docs that addresses it:
conv2d存在两个类似的实现:
signal.conv2d and nnet.conv2d.
前者实现传统的2D卷积,而后者实现 实现卷积神经网络中存在的卷积层 网络(过滤器是3D,并通过多个输入通道汇集)。
在引擎盖下,它们都调用相同的功能,因此唯一的区别是用户界面。
关于你的第二个问题,结果是不同的。等效调用:
conv2(..., subsample=(2,2))
将是:
conv2d(...,subsample=(1,1))[:,:,::2,::2]
换句话说,conv2d
不会占用整个池区域的最大值,而是占用池区域索引[0,0]
的元素。