ignore_const_cols缺少值

时间:2017-07-08 13:19:30

标签: machine-learning statistics h2o

在具有“ignore_const_cols”参数的h2o模型中,如何根据缺失值确定“常量”?

,即如果一列只有一个唯一的非缺失值,并且还有一些缺失值,并且选择了“ignore_const_cols”,那么此列上是否会发生拆分以将缺失值与一个常量值分开?

1 个答案:

答案 0 :(得分:2)

测试这个

很容易

R代码:

library(h2o)
h2o.init()
iris_data<-as.data.frame(iris)
iris_data$Petal.Width<-1
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width)
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')

无论具有缺失值的常量列是数字还是因子,都会给出相同的警告:

Warning message:
In .h2o.startModelJob(algo, params, h2oRestApiVersion) :
  Dropping constant columns: [Petal.Width].

因此,您的问题的答案似乎是在确定列是否为常量时h2o忽略缺失值