我构建了一个修剪的回归树,现在希望获得可变的重要性。为此,我首先看一下AttributeError Traceback (most recent call last)
<ipython-input-9-e013af513ae2> in <module>
4 predictor = rank_model.pipe[-1][-1]
5 candidates = ['environment variable', 'graphical interface', 'broken terminal']
----> 6 predictor.rebuilt_responces(candidates)
AttributeError: 'BertSepRankerPredictor' object has no attribute 'rebuilt_responces'
,它给出了以下输出:
fit$variable.importance
现在,我希望变量的比例值总计为100,并且我阅读了摘要输出为我提供了这些值,因此我尝试使用 Bildungsgrad
226.044063
DauerUnternehmenszugehörigkeit
123.467317
I((DauerUnternehmenszugehörigkeit^2)/100)
122.920833
Branche
72.740264
Unternehmengroesse
71.899719
ArbeitsmarkterfahrungVollzeit
69.797196
I((ArbeitsmarkterfahrungVollzeit^2)/100)
61.964059
inverseMillsRatioPrunedCtreeGiniUs
46.998136
Geschlecht
41.810645
öffenticherDienst
30.134861
I((ArbeitsmarkterfahrungTeilzeit^2)/100)
23.799419
ArbeitsmarkterfahrungTeilzeit
23.158403
Bundesland
20.723566
Migrationshintergrund
7.958936
,但得到的结果相同。之后,我尝试使用插入符号包中的summary(fit)$variable.importance
函数并获得以下输出,这令人困惑,因为它的值> 1,并且它们的总和不超过100。
varImp
如何获取回归树rpart对象的比例变量重要性?