我是神经网络的新手。我正在尝试使用多层神经网络解决分类问题。数据样本由40个要素和8个地面真相类别之一组成。因此存在的问题是,训练数据不大(每个班级至少50个样本)并且不平衡。所实现的网络是一个两层神经元网络,每个神经元网络具有100个神经元。结果对于训练来说是完美的(〜1.00),但是对于测试数据(在0.6到0.9之间)则非常不稳定。
我现在的问题是,如果你们有什么想法,如何使网络更强大?对于较小的数据集,最好是层较少但神经层更多或更多而神经元更少?网络在第一层应具有多少神经元(输入特征向量的维数为40)? 在图像分类中,通常会通过雷电变化,旋转等方法来增强输入图像。特征向量是否有相似之处?