我试图使用命令
在R中构建xgboost模型bstSparsedel <- xgboost(data = data, label = data[,1],max_depth = 6, eta = .3, nthread = 4, nrounds = nrow(train),verbose = 1,early_stopping_rounds = 1)
然后尝试绘制可变重要性图。其中有一个名为measure
的参数,它具有三种类型,即覆盖,增益,频率。不同的参数是什么意思?随着图的每次测量完全改变。
我尝试在很多地方寻找。如果您可以共享链接,将很有帮助。
答案 0 :(得分:0)
来自Understand Your dataset with XGBoost...:
增益是指功能对其所处分支的准确性带来的提高。这个想法是,在将特征X上的新拆分添加到分支之前,存在一些错误分类的元素,在对特征X上添加拆分后,有两个新分支,并且每个分支都更准确(一个分支表示是否您的观察结果在该分支上,则应将其分类为1,而在另一分支上则正好相反。
Cover度量功能所关注的观测值的相对数量。
频率是一种测量增益的简单方法。它仅计算在所有生成的树中使用功能的次数。您不应该使用它(除非您知道为什么要使用它)。