我了解到,sklearn
要求在运行sklearn.ensemble.RandomForestRegressor
方法时将分类特征编码为伪变量或一键编码,而XGBoost
要求相同,但{{1 }}允许在其h2o
方法中使用原始分类特征。由于h2o.estimators.random_forest.H2ORandomForestEstimator
的随机森林实现是建立在h2o4gpu
之上的,这是否意味着不包括对原始分类功能的支持?
答案 0 :(得分:1)
h2o4gpu 中(至少目前)不对分类列提供本机支持,因此您将必须像在中那样对分类列进行一次热编码(或标签编码) sklearn 和 xgboost 。