我对我的项目有一些(新手)问题。我已经重新创建了项目表单this页面。通过添加我自己的GridSearch
超参数进行调整,我有一些问题。这只是使用Boston住房数据集的回归预测工具。
可以here找到我的项目以进行本地测试:
它在Python 3.6和Windows 10上运行。我的问题是:
GridSearch
部分中超参数的一些典型范围是什么? (到目前为止,我已经在网上看到了一些可供测试的评论)
在这种情况下,GridSearchCV
的“最佳分数”在这里代表什么?是最佳调整的超参数的准确性的百分比吗?
在这种情况下,MAE和RMSE之间有什么区别,它们代表的值与预测的“价格”的范围相同吗?例如,在GridSearchCV
调整步骤之后,您将获得3.03的RMSE和2.23的MAE。这是否意味着每$ 1,000价格需要$ 3.03或$ 2.23? (这是价格的比例)
num_boost_rounds
函数和xgb.cv
函数中的xgb.train
是什么?
通常,假设模型如何在新的看不见的数据上运行时,最佳的误差度量是什么? R2,RMSE?
外行术语越多,您在这里的情况就越好,这样我就可以更好地理解这些功能。当您只有自学知识时,有时很难破译我在网上找到的这些功能的更复杂的解释。非常感谢!