使用step_regex
函数为模型构建配方时,它将为原始列中的某些模式创建其他列。完成操作后,是否可以从配方中排除原始列?
例如,在下面的示例中,产品既包含原始的description
列,又包含两个由step_regex
新创建的列。我想要一个与recipe
对象集成的解决方案,以便可以直接在caret::train
中使用它。
library(recipe)
data(covers)
rec <- recipe(~ description, covers) %>%
step_regex(description, pattern = "(rock|stony)", result = "rocks") %>%
step_regex(description, pattern = "ratake families")
rec2 <- prep(rec, training = covers)
with_dummies <- bake(rec2, newdata = covers)
答案 0 :(得分:1)
找到解决方案。我想我可以更改不想用作预测变量的列的作用。
rec <- rec %>% add_role(description, new_role = "dont_use")