如何应用欠采样数据平衡,设置参数?

时间:2020-07-11 17:40:07

标签: python h2o

我正在使用H2O库,我想应用欠采样数据平衡,将参数设置为0.8。我怎样才能做到这一点?我写了这个命令:

from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)

但是balance_classes = True使用随机参数。我想将此参数设为0.8。

我将不胜感激。谢谢。

1 个答案:

答案 0 :(得分:0)

您需要再提供一个参数:class_sampling_factors。 假设有2个类,并且您想对第一个类进行欠采样,然后使用:

cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])

class_sampling_factors必须是浮点列表。列表中的每个元素决定了每个班级的抽样因子。