标签: machine-learning
我在这里找到了一个相关的问题:How to put more weight on certain features in machine learning?,但是是关于功能的。
说我有一个N个实例(或N行)的带有标签的数据集。
N
我知道有些标签是事实,而某些其他标签并不确定,即某些标签中有杂音。
我如何将这些信息整合到机器学习模型中,例如xgboost,以告诉xgboost,将具有验证标签的实例比具有未验证标签的实例赋予更多的权重?
xgboost
答案 0 :(得分:1)
您可以构造一个DMatrix并使用其weight属性为每个实例初始化权重。检查文档here
DMatrix
weight
或fit方法中的sample_weight
sample_weight