如果我有一个数据框,比方说,第1列和第2列中的因子以及第3列中的标签,两者之间有什么区别?
train_pool <- catboost.load_pool(data = training[,1:2], label = training[,3])
和
train_pool <- catboost.load_pool(data = training[,1:2],
label = training[,3], cat_features=c(1,2))
就是说,即使我没有在catboost.load_pool
中明确声明它,它也会自动检测第1和第2列是否是因子并将其转换为数字吗?
b)反正R包中是否有将分类值转换为数字的矩阵?
答案 0 :(得分:0)
它可能是offtop,但是对于我的分类任务,我具有类别标签,并且为了转换成整数,我使用了以下代码:
train_pool <- catboost.load_pool(data = train[-1],
label = as.numeric(as.factor(train[,1]))-1)
在转换之前,它们看起来像:
您可以尝试手动转换特征。