对分类特征的值赋予权重

时间:2021-03-25 23:31:17

标签: classification xgboost categorical-data feature-engineering catboost

假设我们有以下数据集

df = pd.DataFrame({'feature 1':['a','b','c','d','e'],
'feature 2':[1,2,3,4,5],'y':[1,0,0,1,1]})

正如我们所见,feature 1 是分类的。在 XGBoost 或 CatBoost 中常见的基于树的模型中,每个特征下的值都被处理为相同的权重。我想知道如何将权重分配给他们分类的特征的各个值?例如,我希望我的模型将 a 的权重设为 1,b 的权重为 0.5,c 的权重为 2,d 的权重为 1,e 的权重为 0.6。这与为整个特征分配权重不同,因为我试图让模型理解每个特征下的每个值都有其不同的权重。

0 个答案:

没有答案
相关问题