机器学习查询

时间:2018-06-06 22:34:27

标签: python validation machine-learning hyperparameters

如果我错了,请纠正我。 “训练集用于计算机器学习模型的参数,验证数据用于计算同一模型的超参数(我们使用具有不同超参数的相同权重),测试集用于评估我们的模型”。如果是真的,有人可以更详细地解释整个过程。 TIA。

1 个答案:

答案 0 :(得分:0)

假设您在70%的数据上训练随机森林分类器,那么它将帮助您的分类器从此训练数据中识别随机森林分类器的有用属性或特征。但是有很多超级参数,例如随机森林分类器的深度,它影响RF分类器的性能。您可以通过在验证集上绘制精度图表来确定哪个深度可以提供最佳性能(比如说另外10%的数据)。在训练并找到正确的超参数值之后,您可以测试分类器在测试数据上的性能(剩余20%的数据)。