我从教程中裁剪了以下图像。
此图显示了标准神经网络的粗略结构。将一张图像作为输入并进行预测。
与上图中的不完全相同。但是您可以看到我正在尝试使用两张图片做出一个预测。此图像供您了解我要问的问题。
可以像这样或其他方式使用多于一幅(两幅,三幅..)图像来进行一个预测。现在,这将不用于实际的照片分类。但是我认为这种技术可以用于音频分类之类的文件,其中数据的图形表示与图像分类技术一起使用。
对此有任何建议,指导或意见吗?
如果我们考虑完全实现图中的内容,那么如果我使用像Keras(Keras.model.sequential)这样的高级API,我们所能做的就是保持一层一层的添加。
那我可以使用哪种技术来实现并行结构
答案 0 :(得分:0)
是的,您可以使用多个图像作为输入。例如,参见Siamese Neural Network,它将2张图像作为输入并通过共享的网络体系结构传递。
如果您想输入任意数量和可变数量的图像,则可以使用基于递归神经网络的体系结构,例如Convolutional LSTM,该体系结构基本上使用LSTM将CNN应用于输入序列的每个图像循环网络。