catboost R分类转换为数字

时间:2019-02-20 09:27:16

标签: r categorical-data catboost

如果我有一个数据框,比方说,第1列和第2列中的因子以及第3列中的标签,两者之间有什么区别?

train_pool <- catboost.load_pool(data = training[,1:2], label = training[,3])

train_pool <- catboost.load_pool(data = training[,1:2], 
                                 label = training[,3], cat_features=c(1,2))

就是说,即使我没有在catboost.load_pool中明确声明它,它也会自动检测第1和第2列是否是因子并将其转换为数字吗?

b)反正R包中是否有将分类值转换为数字的矩阵?

1 个答案:

答案 0 :(得分:0)

它可能是offtop,但是对于我的分类任务,我具有类别标签,并且为了转换成整数,我使用了以下代码:

train_pool <- catboost.load_pool(data = train[-1],
                                 label = as.numeric(as.factor(train[,1]))-1)

在转换之前,它们看起来像: enter image description here

您可以尝试手动转换特征。