我对使用CNN进行图像识别非常陌生,目前正在使用Keras(VGG和ResNet)中提供的几种标准(预训练)架构进行图像分类任务。我想知道如何将输入通道的数量泛化到3个以上(而不是标准RGB)。例如,我有一个图像是通过5个不同的(光学)滤镜拍摄的,我正在考虑将这5个图像传递到网络。
因此,从概念上讲,我需要将(高度,宽度,深度)=(28,28,5)作为输入传递,其中28x28是图像尺寸,而5是通道数。
请问有使用ResNet或VGG的任何简便方法吗?
答案 0 :(得分:1)
如果您重新训练模型,那不是问题。仅当您要使用经过训练的模型时,才必须保持输入相同。