我只是在研究mlr包R。但是我可以找到的所有教程都集中在每个函数的用法上。我希望我能找到一个全面的示例,其中包括建模的所有步骤。
假设有一个数据:
mydata <- data.frame(type=c('a','a','b','b','c','d','d','d','e','a',
'a','c','b','e','a','d','w','t','r','a',
'b','c','d','w','q','f','d','s','r','r'),
value=c(1,2,1,2,1,3,1,2,3,4,
5,6,2,4,2,6,7,8,5,3,
1,5,6,2,8,6,3,4,6,3),
target=c('y','y','n','n','n','n','n','n','n','n',
'n','n','n','n','n','n','n','n','n','y',
'n','n','n','n','n','n','n','n','y','n'))
您可以看到这是一个不平衡的数据。在目标字段中,只有4行用“ y”表示,而所有其他26行都用“ n”表示。对于分类问题,所有步骤应为:
通常,这是构建模型的正常过程。现在,我只能创建一个虚拟值:
a <- mydata %>%
select(-target) %>%
createDummyFeatures(method = '1-of-n') %>%
mutate(target=mydata$target)
我不知道如何使用mlr建立完整的模型。有人可以帮我提供所有详细信息吗?