应用错误收集

多共线特征在Xgboost中的重要性变量

时间：2019-12-13 15:13:04

标签： machine-learning data-science random-forest decision-tree xgboost

我正在使用60项观测值* 90个特征数据（所有连续变量），并且响应变量也是连续的。这90个功能是高度相关的，其中一些功能可能是多余的。我在python（xgb.feature_importances_）中使用增益特征重要性，总结为1。我运行xgboost 100次，并基于100次运行中的平均变量重要性等级选择特征。假设我选择了10个因素，然后在这10个特征上再次使用相同的超参数运行xgboost，令人惊讶的是，最重要的特征在这10个变量中变得最不重要。

0 个答案:

没有答案

名称具有预处理后的重要图
具有许多功能的R xgboost重要性图
XGBoost的数字和分类特征之间的特征重要性
xgboost分类变量的特征重要性
尽管文档中提到了xgboost，Python中的xgboost并没有恢复功能的重要性
在特征重要性XGBoost中绘制特征名称
Xgboost：打印“所有”功能的重要性
使用XGBoost获得各个功能的重要性
XGBOOST：无法翻转轴的重要性-特征图
多共线特征在Xgboost中的重要性变量

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？