据我所知,当训练时间增加时(直到某一点),测试准确度会增加;但试验韦卡产生了相反的结果。我想知道是否误解了某些东西。 我使用diabetes.arff进行分类,70%用于训练,30%用于测试。我使用了MultilayerPerceptron分类器并尝试了100,500,1000,3000,5000的训练时间。 这是我的结果,
Training time Accuracy
100 75.2174 %
500 75.2174 %
1000 74.7826 %
3000 72.6087 %
5000 70.4348 %
10000 68.6957 %
这可能是什么原因?谢谢!
答案 0 :(得分:1)
你有一个非常好的过度拟合的例子。
您的模型(无论这是多层感知器,决策树还是字面上的任何其他内容)都可以通过两种方式拟合训练数据。
第一个是概括 - 模型试图找到模式和趋势并使用它们进行预测。第二个是记住训练数据集中的确切数据点。
想象一下计算机视觉任务:将图像分为两类 - 人类与卡车。优秀的模型将找到人类图片中存在的共同特征,但不会出现在卡车图片中(光滑的曲线,肤色表面)。这是一种概括。这样的模型将能够很好地处理新图片。糟糕的模型,过度拟合,只会记住精确的图像,训练数据集的精确像素,并且不知道如何处理测试集上的新图像。
处理过度拟合的常用方法很少:
关于过度拟合的良好起点是维基百科:https://en.wikipedia.org/wiki/Overfitting