如何在机器学习中的某些实例上增加权重?

时间:2018-12-21 04:53:45

标签: machine-learning

我在这里找到了一个相关的问题:How to put more weight on certain features in machine learning?,但是是关于功能的。

说我有一个N个实例(或N行)的带有标签的数据集。

我知道有些标签是事实,而某些其他标签并不确定,即某些标签中有杂音。

我如何将这些信息整合到机器学习模型中,例如xgboost,以告诉xgboost,将具有验证标签的实例比具有未验证标签的实例赋予更多的权重?

1 个答案:

答案 0 :(得分:1)

您可以构造一个DMatrix并使用其weight属性为每个实例初始化权重。检查文档here

fit方法中的sample_weight