Tensorflow - 具有多个通道的2D卷积

时间:2018-04-27 16:05:34

标签: python numpy tensorflow computer-vision

我以这种方式定义我的输入和内核

import numpy as np
k = np.array([[
    [1, 0, 1],
    [2, 1, 0],
    [0, 0, 1]
],[
    [1, 0, 1],
    [2, 1, 0],
    [0, 0, 1]
]
], dtype=np.float32)
i = np.array([
    [4, 3, 1, 0],
    [2, 1, 0, 1],
    [1, 2, 4, 1],
    [3, 1, 0, 2]
], dtype=np.float32)

使用

对两者进行卷积
import tensorflow as tf
kernel = tf.reshape(k, [3, 3, 1, 2], name='kernel')
image  = tf.reshape(i, [1, 4, 4, 1], name='image')
res = tf.squeeze(tf.nn.conv2d(image, kernel, [1, 1, 1, 1], "VALID"))
with tf.Session() as sess:
   print sess.run(res)

产生

的结果
[[[11. 12.]
  [ 8.  6.]]

 [[11. 11.]
  [ 8.  8.]]]

我想要做的是用一个"子过滤器"

进行一次卷积
[
[1, 0, 1],
[2, 1, 0],
[0, 0, 1]
]

当时的输入。用笔和纸自己做,我得到

[[[14.  6.]
  [ 6. 12.]]

 [[14.  6.]
  [ 6. 12.]]]

" reshape-parameters"的所有其他排列。屈服错误,我在TF文档中找不到我做错了什么。有谁知道我做错了什么?

1 个答案:

答案 0 :(得分:1)

您只需在计算之前和之后使用here

import numpy as np
import tensorflow as tf

k = np.array([[
    [1, 0, 1],
    [2, 1, 0],
    [0, 0, 1]
],[
    [1, 0, 1],
    [2, 1, 0],
    [0, 0, 1]
]
], dtype=np.float32)
i = np.array([
    [4, 3, 1, 0],
    [2, 1, 0, 1],
    [1, 2, 4, 1],
    [3, 1, 0, 2]
], dtype=np.float32)

with tf.Graph().as_default(), tf.Session() as sess:
    kernel = tf.expand_dims(tf.transpose(k, (1, 2, 0)), 2, name='kernel')
    image  = tf.reshape(i, [1, 4, 4, 1], name='image')
    res = tf.squeeze(tf.nn.conv2d(image, kernel, [1, 1, 1, 1], "VALID"))
    res = tf.transpose(res, (2, 0, 1))
    print sess.run(res)

输出:

[[[ 14.   6.]
  [  6.  12.]]

 [[ 14.   6.]
  [  6.  12.]]]