最大使用“ tf.nn.avg_pool”在张量流中合并单个图像

时间:2019-10-30 20:43:23

标签: python numpy tensorflow conv-neural-network max-pooling

我想在单个图像上应用“ tf.nn.max_pool()”,但是得到的结果与输入的尺寸完全不同:

import tensorflow as tf
import numpy as np

ifmaps_1 = tf.Variable(tf.random_uniform( shape=[ 7, 7, 3], minval=0, maxval=3, dtype=tf.int32))

ifmaps=tf.dtypes.cast(ifmaps_1, dtype=tf.float64)

ofmaps_tf = tf.nn.max_pool([ifmaps], ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding="SAME")[0] # no padding

init = tf.initialize_all_variables()
with tf.Session() as sess:
    sess.run(init)
    print("ifmaps_tf = ")
    print(ifmaps.eval())
    print("ofmaps_tf = ")
    result = sess.run(ofmaps_tf)
    print(result)

我认为这与尝试将池应用到不在批次上的单个示例有关。我需要对一个示例进行汇总。

感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

您的输入为(7,7,3),内核大小为(3,3),步幅为(2,2)。因此,如果您不希望使用任何填充(请在注释中注明),则应使用padding="VALID",它将返回一个(3,3)张量作为输出。如果使用padding="SAME",它将返回(4,4)张量。

通常,计算SAME打击垫的输出尺寸的公式为:

out_size = ceil(in_sizei/stride)

有效垫是:

out_size = ceil(in_size-filter_size+1/stride)