假设我们有以下数据集
df = pd.DataFrame({'feature 1':['a','b','c','d','e'],
'feature 2':[1,2,3,4,5],'y':[1,0,0,1,1]})
正如我们所见,feature 1
是分类的。在 XGBoost 或 CatBoost 中常见的基于树的模型中,每个特征下的值都被处理为相同的权重。我想知道如何将权重分配给他们分类的特征的各个值?例如,我希望我的模型将 a
的权重设为 1,b
的权重为 0.5,c
的权重为 2,d
的权重为 1,e
的权重为 0.6。这与为整个特征分配权重不同,因为我试图让模型理解每个特征下的每个值都有其不同的权重。