我读了一些书,但仍然不能确定我应该如何组织网络。例如,我有pgm图像,大小为120 * 100,输入应该如何(就像一个大小为120 * 100的一维数组)?我应该适应多少节点。
答案 0 :(得分:1)
通常最好将输入图像组织为2D矩阵。原因在于机器感知任务中使用的神经网络的较低层的层通常是本地连接的。例如,这种神经网络的第一层的每个神经元将仅处理输入图像的小N×N块的像素。这自然导致2D结构,可以用2D矩阵更容易地描述。
有关详细说明,我将引用您的DeepFace论文,该论文描述了人脸识别系统的最新技术。
答案 1 :(得分:1)
120 * 100一维向量精细。该向量中像素值的位置无关紧要,因为无论如何所有节点都与下一层中的节点完全连接。但是,您必须在培训,验证和测试之间保持一致。
答案 2 :(得分:1)
迄今为止最成功的方法是使用带有2D输入的卷积神经网络,正如@benoitsteiner所述。对于一个更简单的例子,我将向您推荐一个LeNet-5,一个为MNIST手写数字识别开发的小型神经网络。它在EBLearn中用于人脸识别,效果非常好。