如何在CatBoost中使用非数字标签值将分类特征转换为数字特征

时间:2019-11-29 04:02:36

标签: categorical-data multiclass-classification catboost

我目前正在用python学习CatBoost分类器,以便训练增强型树模型。我了解了CatBoost使用的编码方案(基于目标的编码),如果目标值是数字或它是“二进制分类问题”。但是,我无法从Catboost的官方网站上找到有关在多分类领域中分类特征编码的任何细节,尽管它们确实支持带有字符串标签值的多类问题。我从文档中发现的全部是标签值是目标类的整数标识符(从“ 0”开始)。看来CatBoost会通过某种标签编码(可能基于训练数据中它们的出现顺序)将标签值自动转换为数值。我试图阅读源代码以弄清楚它,但无法发现有关分类数据转换实现的任何信息。熟悉使用CatBoost的人可以给我提示吗?

0 个答案:

没有答案
相关问题