在具有“ignore_const_cols”参数的h2o模型中,如何根据缺失值确定“常量”?
,即如果一列只有一个唯一的非缺失值,并且还有一些缺失值,并且选择了“ignore_const_cols”,那么此列上是否会发生拆分以将缺失值与一个常量值分开?
答案 0 :(得分:2)
测试这个
很容易R代码:
library(h2o)
h2o.init()
iris_data<-as.data.frame(iris)
iris_data$Petal.Width<-1
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width)
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
无论具有缺失值的常量列是数字还是因子,都会给出相同的警告:
Warning message:
In .h2o.startModelJob(algo, params, h2oRestApiVersion) :
Dropping constant columns: [Petal.Width].
因此,您的问题的答案似乎是在确定列是否为常量时h2o忽略缺失值