如何使用1 x 2内核在2 x 2矩阵上进行张量处理?

时间:2017-07-06 03:56:32

标签: tensorflow convolution

我有以下矩阵:

以及以下内核:

如果我在没有填充的情况下进行卷积并按1行滑动,我应该得到以下答案:

由于:

基于tf.nn.conv2d的文档,我认为此代码表达了我刚才描述的内容:

import tensorflow as tf

input_batch = tf.constant([
    [
        [[.0], [1.0]],
        [[2.], [3.]]
    ]
])

kernel = tf.constant([
    [
        [[1.0, 2.0]]
    ]
])

conv2d = tf.nn.conv2d(input_batch, kernel, strides=[1, 1, 1, 1], padding='VALID')
sess = tf.Session()

print(sess.run(conv2d))

但它产生了这个输出:

[[[[ 0.  0.]
   [ 1.  2.]]

  [[ 2.  4.]
   [ 3.  6.]]]]

我不知道如何计算。我已经尝试使用strides padding参数的不同值进行试验,但仍然无法产生我预期的结果。

1 个答案:

答案 0 :(得分:2)

您在链接的教程中没有正确阅读我的解释。在对no-padding, strides=1进行直接修改后,您可以获得以下代码。

import tensorflow as tf
k = tf.constant([
    [1, 2],
], dtype=tf.float32, name='k')
i = tf.constant([
    [0, 1],
    [2, 3],
], dtype=tf.float32, name='i')
kernel = tf.reshape(k, [1, 2, 1, 1], name='kernel')
image  = tf.reshape(i, [1, 2, 2, 1], name='image')

res = tf.squeeze(tf.nn.conv2d(image, kernel, [1, 1, 1, 1], "VALID"))
# VALID means no padding
with tf.Session() as sess:
   print sess.run(res)

它为您提供了预期的结果:[2., 8.]。由于挤压操作符,我在这里得到了一个向量而不是列。

我在您的代码中看到的一个问题(可能还有其他问题)是您的内核形状为(1, 1, 1, 2),但它假设为(1, 2, 1, 1)