为什么神经网络对置换标签给出相同的准确度?

时间:2015-07-14 15:54:27

标签: machine-learning statistics neural-network deep-learning p-value

我有一个37个数据点的数据集和大约1300个功能。有4个不同的类,每个类具有大约相同数量的数据点。我已经训练了一个神经网络,准确度为60%,两个隐藏层也不错(机会等级为25%)。

现在问题在于p值。我正在用置换测试计算p值。我正在对标签进行1000次置换,并且对于每个排列,我正在计算准确度。我将p值计算为相对于原始精度的置换精度的百分比。

对于标签的所有排列,我获得与原始标签相同的精确度,即神经网络似乎不包括学习中的标签。

如果我使用SVM,我会得到所有排列的不同精度(最终像高斯分布)。

为什么会这样?

顺便说一下,我正在使用DeepLearnToolbox for Matlab。

1 个答案:

答案 0 :(得分:2)

培训数据或您预留的验证数据集的成功率是60%吗?

如果您仅仅根据训练数据计算成功率,那么即使在置换标签后您也可以获得高精度。这是因为您的分类器将过度拟合数据(1300个特征到37个数据点)并在训练数据上获得良好的性能。