我刚刚开始编程,并创建了一个线性回归模型,该模型使我可以从中提取均方根误差来确定模型的准确性。但这只是该模型的1次试验,因此获得的均方根误差不尽如人意。我想学习如何多次执行此线性回归,但是如何选择数据的不同部分/子集作为测试和训练集,但每次回归都需要test_size = 0.25
。
因此我可以从所有这些线性回归试验中找到平均均方根误差,因为该均方根误差将比我从单个试验中获得的均方根误差最准确/更准确。
建议我在https://jakevdp.github.io/PythonDataScienceHandbook/05.03-hyperparameters-and-model-validation.html进行交叉验证,因为它会根据测试大小来训练和测试数据的不同部分。但是它使用了邻居分类器而不是线性回归,并且使用了我不需要的模型评分。