我应该如何检查该模型在训练和测试方面都具有极高的分数?

时间:2019-04-04 08:59:07

标签: machine-learning random-forest

我正在使用随机森林进行二进制分类,测试大小为0.3,cv为5倍,对于训练和测试,精度和召回率均超过99%,我是否过度拟合?

2 个答案:

答案 0 :(得分:0)

如果只对火车进行了70-30次火车测试拆分和5折CV。之后,达到99%的精度并在TEST集合上调用即可,您已经涵盖了所有步骤。

您可以验证的是测试和火车分组中数据分布的比例。 对y_train和y_test取平均值。验证您得到可比较的数字。

答案 1 :(得分:0)

检查来自训练数据集和测试数据集的样本是否不同,并可能尝试在一些新的实际样本上运行。