应用错误收集

如何在机器学习中的某些实例上增加权重？

时间：2018-12-21 04:53:45

标签： machine-learning

我在这里找到了一个相关的问题：How to put more weight on certain features in machine learning?，但是是关于功能的。

说我有一个N个实例（或N行）的带有标签的数据集。

我知道有些标签是事实，而某些其他标签并不确定，即某些标签中有杂音。

我如何将这些信息整合到机器学习模型中，例如xgboost，以告诉xgboost，将具有验证标签的实例比具有未验证标签的实例赋予更多的权重？

1 个答案:

答案 0 :(得分：1)

您可以构造一个DMatrix并使用其weight属性为每个实例初始化权重。检查文档here

或fit方法中的sample_weight