Question

根据keras文档（https://keras.io/layers/convolutional/），Conv1D输出张量的形状是（batch_size，new_steps，filters），而输入张量形状是（batch_size，steps，input_dim）。我不明白这是怎么回事，因为这意味着如果你传递长度为8000的1d输入，其中batch_size = 1且步数= 1（我听到步骤意味着输入中的＃个通道）然后此图层的输出形状为（1,1，X），其中X是Conv图层中的滤镜数。但是输入维度会发生什么？由于图层中的X滤镜应用于整个输入尺寸，因此其中一个输出尺寸不应为8000（或者更少，具体取决于填充），类似于（1,1,8000，X）？我检查过，Conv2D图层的行为方式更符合他们的output_shape（samples，filters，new_rows，new_cols），其中new_rows和new_cols将是基于填充再次调整的输入图像的尺寸。如果Conv2D图层保留其输入尺寸，为什么不要使用Conv1D图层？我在这里找不到什么东西？

背景资料：

我试图想象我的CNN的1d卷积层激活，但我发现大多数在线工具似乎只适用于2d卷积层，所以我决定为它编写我自己的代码。我已经很好地理解了它是如何工作的，这是我到目前为止所获得的代码：

# all the model's activation layer output tensors
activation_output_tensors = [layer.output for layer in model.layers if type(layer) is keras.layers.Activation]

# make a function that computes activation layer outputs
activation_comp_function = K.function([model.input, K.learning_phase()], activation_output_tensors)

# 0 means learning phase = False (i.e. the model isn't learning right now)
activation_arrays = activation_comp_function([training_data[0,:-1], 0])

此代码基于julienr在此thread中的第一条评论，并对当前版本的keras进行了一些修改。当我使用它的时候，虽然所有的激活阵列都是形状的（1,1，X）......我昨天花了整整一天试图找出原因，但没有运气任何帮助都非常感激。

更新：结果我误认为input_dimension的含义与步骤维度。这主要是因为我使用的架构来自另一个在mathematica中构建模型的组，而在mathematica中，（X，Y）到Conv1D层的输入形状意味着X＆＃34; channel＆＃34; （或X的input_dimension）和Y步。感谢gionni帮助我实现这一点，并很好地解释了＆＃34; input_dimension＆＃34;成为＆＃34;过滤器＆＃34;尺寸。

Answer 1

我过去常常遇到2D卷积问题。问题在于，当您应用卷积层时，您应用的内核的大小不是(kernel_size, 1)，而是(kernel_size, input_dim)。

如果您认为不是这样的话，带kernel_size = 1的1D卷积层对其收到的输入无效。

相反，它计算每个时间步的输入要素的加权平均值，每个时间步使用相同的权重（尽管每个过滤器使用不同的权重集）。我认为将input_dim可视化为图像的2D卷积中channels的数量是有帮助的，其中相同的reanoning适用（在这种情况下是channels得到的＃{1}}丢失＆＃34;并转换为过滤器的数量。）

为了说服自己，您可以使用kernel_size=(1D_kernel_size, input_dim)和相同数量的滤镜重现2D卷积层的1D卷积。这是一个例子：

from keras.layers import Conv1D, Conv2D
import keras.backend as K
import numpy as np

# create an input with 4 steps and 5 channels/input_dim
channels = 5
steps = 4
filters = 3
val = np.array([list(range(i * channels, (i + 1) * channels)) for i in range(1, steps + 1)])
val = np.expand_dims(val, axis=0)
x = K.variable(value=val)

# 1D convolution. Initialize the kernels to ones so that it's easier to compute the result by hand

conv1d = Conv1D(filters=filters, kernel_size=1, kernel_initializer='ones')(x)

# 2D convolution that replicates the 1D one

# need to add a dimension to your input since conv2d expects 4D inputs. I add it at axis 4 since my keras is setup with `channel_last`
val1 = np.expand_dims(val, axis=3)
x1 = K.variable(value=val1)

conv2d = Conv2D(filters=filters, kernel_size=(1, 5), kernel_initializer='ones')(x1)

# evaluate and print the outputs

print(K.eval(conv1d))
print(K.eval(conv2d))

正如我所说，我花了一段时间才明白这一点，我认为主要是因为没有教程明确解释

为什么Keras Conv1D层次＆＃39;输出张量没有输入维度？

1 个答案: