我们能否建立一个使用多个图像进行预测的卷积网络

时间:2019-12-04 08:33:02

标签: neural-network deep-learning classification conv-neural-network

我从教程中裁剪了以下图像。

enter image description here

此图显示了标准神经网络的粗略结构。将一张图像作为输入并进行预测。

我正在考虑的是某种并行结构。考虑以下图像。 enter image description here

与上图中的不完全相同。但是您可以看到我正在尝试使用两张图片做出一个预测。此图像供您了解我要问的问题。

可以像这样或其他方式使用多于一幅(两幅,三幅..)图像来进行一个预测。现在,这将不用于实际的照片分类。但是我认为这种技术可以用于音频分类之类的文件,其中数据的图形表示与图像分类技术一起使用。

对此有任何建议,指导或意见吗?

如果我们考虑完全实现图中的内容,那么如果我使用像Keras(Keras.model.sequential)这样的高级API,我们所能做的就是保持一层一层的添加。

那我可以使用哪种技术来实现并行结构

1 个答案:

答案 0 :(得分:0)

是的,您可以使用多个图像作为输入。例如,参见Siamese Neural Network,它将2张图像作为输入并通过共享的网络体系结构传递。

如果您想输入任意数量和可变数量的图像,则可以使用基于递归神经网络的体系结构,例如Convolutional LSTM,该体系结构基本上使用LSTM将CNN应用于输入序列的每个图像循环网络。