我有大约1100个样本集,每个样本集18个值。请建议培训/验证/评估的最佳分配百分比。我正在使用PNN和SVM神经网络进行分类问题,并得出3种可能的结果。
请解释你的推理。 感谢。
答案 0 :(得分:0)
我不相信会有任何最佳答案,但真的可以归结为神经网络对训练数据的表现。
我通常会将数据拆分为60/20/20,但这可能会因数据的质量和复杂程度而发生变化。
您可以使用不同的组合运行一些测试,看看它会如何影响您的验证/评估性能。
希望这有帮助!
答案 1 :(得分:0)
为了确保您能够对此数据集进行分类,请使用Cross-Validation methods。如果您正在使用training set
,validation set
和test set
等三个集合,则可以将整个集合划分为五个部分,每个部分为20%。通过这种方式,您可以重新排列这些部件,以确保您已在所有设备中测试过您的模型。
我。
[1, 2, 3] - training
[4] - validation
[5] - test
II。
[2, 3, 4] - training
[5] - validation
[1] - test
III。
[3, 4, 5] - training
[1] - validation
[2] - test
IV
[4, 5, 1] - training
[2] - validation
[3] - test
诉P>
[5, 1, 2] - training
[3] - validation
[4] - test
我认为没有完美的方法,您可以在apporach上浏览dataSet并查看结果。您也不需要保留订单。