哪个类应该(二进制)R包mlr的因子变量?

时间:2017-08-16 11:42:18

标签: r machine-learning mlr

我想准备一个数据集,以便在Taskmlr包中使用它。二元因子自变量应该是类因子,逻辑,字符还是整数?是否可以将具有多于2个类的因子变量作为因子/字符,或者是否存在集成在mlr中的模型,其需要例如一个模型矩阵,其中mlr不会自动进行转换? mlr对这些案件有哪些类别?

例如:

x1 <- factor(sample(0:1, size=10, replace = TRUE))
x2 <- factor(sample(letters[1:5], size=10, replace = TRUE))
y <- sample(c("yes", "no"), size=10, replace = TRUE)
library(mlr)
makeClassifTask(data = data.frame(y, x1, x2), target = "y", positive="yes")

1 个答案:

答案 0 :(得分:2)

是。如果它是一个因素,它应该是一个因素。您当然可以有两个以上的课程,但并非所有学习者都支持两个以上的课程(mlr将负责确定学习者是否自动兼容)。 mlr总是自动将任务中的所有内容转换为适合学习者,或者告诉您学习者和任务不兼容。

您还可以使用函数listLearners()列出适合给定任务的学员。