具有任意数量输入通道(超过RGB)的卷积神经网络体系结构

时间:2018-08-27 21:20:09

标签: python tensorflow image-processing keras conv-neural-network

我对使用CNN进行图像识别非常陌生,目前正在使用Keras(VGG和ResNet)中提供的几种标准(预训练)架构进行图像分类任务。我想知道如何将输入通道的数量泛化到3个以上(而不是标准RGB)。例如,我有一个图像是通过5个不同的(光学)滤镜拍摄的,我正在考虑将这5个图像传递到网络。

因此,从概念上讲,我需要将(高度,宽度,深度)=(28,28,5)作为输入传递,其中28x28是图像尺寸,而5是通道数。

请问有使用ResNet或VGG的任何简便方法吗?

1 个答案:

答案 0 :(得分:1)

如果您重新训练模型,那不是问题。仅当您要使用经过训练的模型时,才必须保持输入相同。