Python SkLearn梯度Boost分类器Sample_Weight澄清度

时间:2018-08-30 11:39:30

标签: python scikit-learn gradient boosting

使用Python SkLearn梯度增强分类器。我使用的设置是选择随机样本(随机)。对于一个二进制类(结果= 0)使用sample_weight为1,对于另一个类(结果= 1)使用sample_weight。我的问题是这些权重如何以“外行术语”应用。

是在每次迭代中,模型将从样本中选择x行作为0结果,将y行作为1结果,然后sample_weight设置将插入并保留所有x,但对y进行过采样(1 )的效果提高了20倍?

在文档中,我不清楚是否具有sample_weight> 1来进行过采样。我知道class_weight是不同的,不会更改数据,而是模型如何通过损失函数解释数据。另一方面,Sample_weight是否通过过采样有效地更改了馈入模型的数据?

谢谢

1 个答案:

答案 0 :(得分:0)