我是CatBoost的新手,并且正在使用logging_level = "Info"
进行CatBoostClassifier培训。我的数据既包含类别变量,也包含数值变量。
首先,对于其中一个分类变量,我在打印的信息中得到以下消息:feature 21 is redundant categorical feature, skipping it
。如何确定此功能的冗余性?
此外,关于迭代的所有信息代表什么,我有些迷茫。这是我训练的一次迭代的信息输出:
{Feature1} pr0 tb1 type0, border=10 score 2.001737609
Feature2, bin=40 score 2.867480488
{Feature3, Feature2 b40} pr2 tb2 type0, border=6 score 3.533462883
Feature4, bin=5 score 4.105045044
46: learn: -1.2759319 total: 13.2s remaining: 843ms
在这种情况下,Feature1和Feature3是分类的,而Feature2和Feature4是数字的。
pr0
,tb1
,type0
,score
等所有值代表什么?任何指向文档的指针将不胜感激。