应用错误收集

训练集和测试集的大小

时间：2013-06-21 13:46:22

标签： machine-learning data-mining data-analysis

当训练集小于特定情况的测试集时会发生什么。在使用这些类型的数据集进行预测时，什么是合适的方法。任何人都可以给我一些介绍来管理这些情况以及每种学习算法的表现。

2 个答案:

答案 0 :(得分：2)

您关注的是什么？你有什么不好期待从中产生什么？验证太多了？ Overvalidation？

测试集不参与训练分类器。

它只是为了让您预测分类器的质量以便将来的数据。

因此，如果你有一个大的测试集，你可能会更好地预测你的分类器的质量，就是这样。

答案 1 :(得分：0)

当您拥有一个小型训练集和大型测试集时，一种解决方案是组合这些集合并使用k-fold交叉验证。但是，理想情况下，你会积累更大的训练集。谨防在不适合的问题上使用开箱即用的机器学习。