classification - 对分类特征的值赋予权重

假设我们有以下数据集

df = pd.DataFrame({'feature 1':['a','b','c','d','e'],
'feature 2':[1,2,3,4,5],'y':[1,0,0,1,1]})

正如我们所见，feature 1 是分类的。在 XGBoost 或 CatBoost 中常见的基于树的模型中，每个特征下的值都被处理为相同的权重。我想知道如何将权重分配给他们分类的特征的各个值？例如，我希望我的模型将 a 的权重设为 1，b 的权重为 0.5，c 的权重为 2，d 的权重为 1，e 的权重为 0.6。这与为整个特征分配权重不同，因为我试图让模型理解每个特征下的每个值都有其不同的权重。

对分类特征的值赋予权重

0 个答案: