b,y,x和c是什么会变平并与tf.nn.max_pool_with_argmax中的最大合并特征一起返回?

时间:2018-12-24 15:12:06

标签: python tensorflow conv-neural-network max-pooling

我浏览了tf.nn.max_pool_with_argmax的文档

  

对输入执行最大池化,并输出最大值和索引。

     

argmax中的索引被展平,因此最大值为   位置[b,y,x,c]变为变平的索引((b *高度+ y)*   宽度+ x)*通道+ c。

     

返回的索引始终在[0,高度)x [0,宽度)之前   展平,即使涉及填充并且在数学上正确   答案在外面(否定或太大)。这是一个错误,但是   修复很难以安全的向后兼容方式进行操作,   尤其是由于展平。

尚未明确定义变量b,y,x和c,因此在实现此方法时遇到了问题。有人可以提供吗?

1 个答案:

答案 0 :(得分:0)

由于声誉我无法发表评论。

但是我认为变量引用了“最大池”窗口的位置和大小。 x和y是内核沿输入矩阵移动时x和y的位置,b和c是内核的宽度和高度。您将在内核大小中设置b和c。

如果使用argmax实现最大池化时遇到问题,则与这些变量无关。您可能要指定最大池化所遇到的问题。