有关超参数调整以及MAE和RMSE的问题

时间:2019-07-28 20:44:28

标签: python python-3.x regression xgboost

我对我的项目有一些(新手)问题。我已经重新创建了项目表单this页面。通过添加我自己的GridSearch超参数进行调整,我有一些问题。这只是使用Boston住房数据集的回归预测工具。
可以here找到我的项目以进行本地测试:

它在Python 3.6和Windows 10上运行。我的问题是:

  1. GridSearch部分中超参数的一些典型范围是什么? (到目前为止,我已经在网上看到了一些可供测试的评论)

  2. 在这种情况下,GridSearchCV的“最佳分数”在这里代表什么?是最佳调整的超参数的准确性的百分比吗?

  3. 在这种情况下,MAE和RMSE之间有什么区别,它们代表的值与预测的“价格”的范围相同吗?例如,在GridSearchCV调整步骤之后,您将获得3.03的RMSE和2.23的MAE。这是否意味着每$ 1,000价格需要$ 3.03或$ 2.23? (这是价格的比例)

  4. num_boost_rounds函数和xgb.cv函数中的xgb.train是什么?

  5. 通常,假设模型如何在新的看不见的数据上运行时,最佳的误差度量是什么? R2,RMSE?

外行术语越多,您在这里的情况就越好,这样我就可以更好地理解这些功能。当您只有自学知识时,有时很难破译我在网上找到的这些功能的更复杂的解释。非常感谢!

0 个答案:

没有答案