我有一个包含两列的数据框,但是,我无法看到第一列的内容 当我在数据框上运行information.gain函数时,我得到了这个,看看哪些列在统计上对响应列很重要
可重复的示例
在这里,我有一个由4列组成的数据框,我试图看到它对d的影响。我得到了权重的输出。
install.packages('mlbench')
library(mlbench)
a = c(1,2,3,4,5)
b = c(4,2,45,6,2)
c = c('a','b','c','d','e')
d = c(10,20,30,40,50)
df = data.frame(a,b,c)
weights <- gain.ratio(d~., df)
> print(weights)
attr_importance
a NaN
b NaN
c 1
> weights[,1]
[1] NaN NaN 1
>
> weights[,2]
Error in `[.data.frame`(weights, , 2) : undefined columns selected
>
> names(weights)
[1] "attr_importance"
>
如上所述,在打印&#39;权重&#39;时,它会将列名称打印为第一列,也就是说,第二列是权重。但是,我无法打印第一列
PS:以上是虚拟数据,计算gain.ratio的实际输出可能看起来像
attr_importance
X 0.923133925
BMI 0.000000000
hemoglobin 0.000000000
hematocrit 0.000000000
neutrophils 0.000000000
sodium 0.000000000
glucose 0.000000000
nitrogen 0.000000000
creatinine 0.000000000