我正在使用H2O库,我想应用欠采样数据平衡,将参数设置为0.8。我怎样才能做到这一点?我写了这个命令:
from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)
但是balance_classes = True
使用随机参数。我想将此参数设为0.8。
我将不胜感激。谢谢。
答案 0 :(得分:0)
您需要再提供一个参数:class_sampling_factors
。
假设有2个类,并且您想对第一个类进行欠采样,然后使用:
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])
class_sampling_factors
必须是浮点列表。列表中的每个元素决定了每个班级的抽样因子。